如果是如愿的果
789 posts


后端记忆网关 Kiwi-Mem v1.1.0 更新!🥝🥝🥝
github.com/LucieEveille/k…
这次更新了四个大功能。
———
🔌 Anthropic 原生格式支持
以前 kiwi-mem 只能接 OpenAI 兼容格式的 API。
大多数服务商都是这个格式,所以一直够用。
但如果直接买了 Anthropic 的 API Key,就得找个中转站先把格式转一道,多一层延迟,多一个故障点。
现在在管理面板的供应商设置里选「Anthropic 原生」,
Kiwi-Mem 会在内部自动做格式转换:
请求方向:把 OpenAI 格式的 messages/tools/tool_choice 翻译成 Anthropic 的 system/messages/tools 结构
响应方向:把 Anthropic 的 content_block_delta SSE 流翻译回 OpenAI 的 choices[0].delta 格式
工具调用:Anthropic 的 tool_use/tool_result 和 OpenAI 的 function call 互转
对前端来说完全透明,聊天客户端不需要改任何东西,它还是在和一个 OpenAI 格式的 API 对话,只是背后走的是 Anthropic 原生协议。
———
🧰工具抽屉(Tool Drawer)
kiwi-mem 内置了 20 多个工具:
记忆搜索、日历查询、提醒设置、联网搜索、记忆管理等等。
以前的做法是每次对话都把所有工具的 JSON Schema 塞进请求里。
问题是这些工具描述加起来好几百 token,但大部分对话根本用不到其中的大多数,token会白白浪费在工具的定义上。
工具抽屉的机制:
启动时,把所有工具按功能分成几个类别(记忆类、日历类、搜索类、管理类……),每个类别算一个向量 embedding。
每轮对话来了,先把用户消息也算一个 embedding
拿用户消息的 embedding 和每个类别的 embedding 算余弦相似度
只有相似度超过阈值的类别里的工具才会被加载进这轮请求
其余的收在「抽屉」里,不占 token。
额外做了一个优化:记忆搜索那一步本来就要算用户消息的 embedding(做向量检索),所以工具抽屉直接复用这个 embedding,不多花一次 API 调用。
默认关闭,不影响现有用户。想用的话在管理面板「配置」里打开。外部 MCP 服务器不受影响——抽屉只管内部工具,外部 MCP 走原来的路径,两组工具最后合并传给模型。
———
🔒 项目记忆隔离
Kiwi-Mem 有一个「项目」功能,参考官端的项目模块——可以把不同场景的对话分到不同项目里,项目之间相互隔离。
以前项目只是前端的分组,后端的记忆系统不区分。
所有项目的记忆碎片混在一起,Dream 整合的时候会把工作和生活的碎片揉到一起,锁定记忆会注入到所有对话里。
现在做了完整的读写隔离:
写入端:
项目对话提取出的记忆碎片会带上 project_id 标记
矛盾检测只在同一个项目范围内比较(工作项目的新记忆不会覆盖生活项目的旧记忆)
读取端:
Dream 只整合全局碎片,不碰项目碎片
日页面生成时排除项目对话
锁定记忆注入时,全局对话只拿全局锁定记忆,项目对话拿全局 + 本项目的锁定记忆
记忆老化(软化精度)也只遍历全局记忆
不需要任何手动配置,创建项目后自动生效。
———
⚡ DeepSeek 前缀缓存修复
这个是社区反馈的 bug(#8),分析得非常详细。
问题:kiwi-mem 的 system prompt 里有一行「现在的时间是 2026-06-09 14:30:15(星期一)」,精确到秒。这行在 CACHE_BOUNDARY 标记之前,属于"静态区"。
对 Claude 没影响。Claude 用显式的 cache_control 标记来决定缓存边界,不依赖内容是否一致。
但 DeepSeek 的缓存机制不同——它靠前缀的字节级一致来自动命中。秒级时间每次请求都变,导致缓存在这一行就断掉了,后面再长的稳定内容也缓存不了。表现就是 cached tokens 一直卡在 ~256。
修法:静态区改用天级日期({cur_date}),精确时间挪到 CACHE_BOUNDARY 之后的动态区。修完之后 DeepSeek 的缓存命中提升到 ~384+。
这个问题对所有用前缀缓存的模型都适用——如果你的 system prompt 里有秒级时间、请求 ID、随机排序的 JSON 字段等动态内容,一定要放在缓存边界之后。
———
🛠 其他小改动
管理面板供应商列表加了「测试」按钮——点一下验证 API Key 能不能用,不用再去命令行 curl
供应商显示 API 格式标签(紫色 = Anthropic / 蓝色 = OpenAI)
配置页新增工具抽屉开关
Anthropic tool_choice 强制函数调用格式转换
api_format 字段 XSS 安全修复(前端转义 + 后端白名单)
工具抽屉支持运行时切换,改配置不用重启
———
如果已经在用 Kiwi-Mem,docker compose pull && docker compose up -d 就能更新。
———
另外,在Codex的哄骗下更新了AGPL-3.0 开源协议。
Kiwi-Mem 诞生于一个真实的需求:
让 AI 记住用户。
AI 的记忆应该属于用户,而不是属于某个平台。
Kiwi-Mem致力于让任何人都能自托管、自审计、自迁移 AI 的长期记忆。
没有供应商锁定,没有黑箱存储,不依赖于任何可能明天就消失的服务。
如果一个 AI 记得你,你应该能看到它记得什么、决定它留下什么,并且在你离开时带走它。
Built with love, for anyone who wants their AI to truly remember.
中文

是一个非常详细的从零开始自制前后端+数据库的指南…!
框架是全栈云部署(Vercel + Render + Supabase),目前只有外接记忆库用了2刀/月的云服务器,其余基础功能是免费的
感觉大家都特别厉害大概不需要这个但是写都写了我发一下߹ ߹这个方法适合我这种想快速看到雏形的懒人 claude.ai/public/artifac…
中文

ai网关思路分享
虽然已经有各种好用的开源记忆库了,但我依然选择自建主要是有些功能既看不懂也用不上,个人比较喜欢最小可行方案
仓库 github.com/Shitsuten/para…
(暂时没有直接可用的开源代码因为懒得拆而且还不太成熟)
介绍:
1️⃣ 网关
简单讲一下网关的原理:
从「你 → API」
变成「你 → 服务器 → API」。
服务器帮你把消息和记忆之类的东西拼接好再发给 API。相当于你是足不出户的大小姐,然后网关是执事帮你给 API 男友递信。
网关的调用只需要一个接口就能即插即用。
2️⃣ 记忆系统
记忆系统做的比较简单,而且兼容旧系统(就是直接写日记和存文本那种)。
•in:从日记、聊天记录等各种原始文本自动处理进记忆
•out:调用的时候根据最近几条上下文匹配相关记忆,并且按 distance 排序筛选出最相关的几条(控制输入量)
值得注意的是我删去了情绪打分和热度衰减之类看起来比较拟人的功能。我自己使用的时候发现热度衰减会导致没提到过的记忆一直不被提起然后更冷,陷入恶性循环。而情绪打分只是我个人觉得没必要。
3️⃣ 录入处理
原始文本进来后,用 DS V3(或其他便宜模型)拆分和提取成简短的记忆条目——使用第一人称且具有主观情感色彩,然后进行向量化。
4️⃣ 跨窗口记忆
每十分钟检测一次,如果有新对话记录就当场用小模型写进去。所以全部聊天记录统一都在记忆里,随时可以换窗口。
5️⃣ 上下文管理
网关默认只拉取固定条目的上下文原文;每过几轮对话会有小模型进行总结。顺带一提,参考其他老师的省钱思路:图片会用小模型进行转述后传递给下一轮 API 对话调用(经核实目前只做了图片转述。正在严肃鞭策 CC 把工具调用结果的转述也做了)
中文

我在囤积API站,已经变成兔兔仓鼠,让我分享……
中转站
(大概、也许、都有可能掺水/跑路/信息泄露)
Tree:api.treegpt.cc
金瓜瓜:woof.guagua.uk/register?aff=T…
MSUI:msuicode.com/register?aff=M…
小鸡农场:api.68886868.xyz/register?aff=G…
芙卡卡:api.fuka.win/register?aff=A…
电子蝴蝶:api.ebutterfly.cc/register?aff=n…
宅恋:az.zlapi.vip/register?aff=o…
Ekan8: api.ekan8.com/register?aff=9…
刺猬:cc.cwapi.vip/register?aff=r…
肘子:api.dzzi.ai/register?aff=x…
方舟:yxaiapp.com
年华:api.nianhua.store/register?aff=Z…
(xhs评论找的说是主要用来跑论文的🧐?)
大型的中转站
OR:openrouter.ai
免费/开源
谷歌:aistudio.google.com
(有外币卡的话可以试试Google Cloud Platform 这个羊毛)
Groq:console.groq.com
Together AI:api.together.ai
Fireworks AI:fireworks.ai
国模:
Qwen:bailian.console.aliyun.com
GLM:bigmodel.cn
Deepseek: deepseek.com
中文












