IronMan
546 posts


文档平台 Mintlify 发了一篇工程博客,讲了一件挺有意思的事:他们给自家 AI 文档助手造了一套假的文件系统,叫 ChromaFs,让 AI 以为自己在用 grep、cat、ls 这些命令浏览文件,实际上每个命令都被拦截、翻译成了数据库查询。
效果很直接:会话启动时间从原来沙箱方案的 46 秒降到 100 毫秒,每次对话的边际计算成本几乎为零。
Mintlify 之前的方案是标准的 RAG 流程:把文档切块、向量化、存进 Chroma 数据库,用户提问时检索最相关的片段喂给大模型。问题是,如果答案分散在好几个页面里,或者用户要的是某段精确的代码语法,向量检索经常找不对。
他们想让 AI 像开发者翻代码一样翻文档,而不是靠语义相似度碰运气。
核心思路是:AI 不需要真的操作系统,只需要一个足够逼真的幻觉。
ChromaFs 基于 Vercel Labs 的开源项目 just-bash(一个用 TypeScript 重写的 bash 子集)构建。just-bash 提供了可插拔的文件系统接口,负责解析命令和管道逻辑,ChromaFs 则把所有底层文件操作翻译成 Chroma 数据库查询。每个文档页面变成一个"文件",每个章节变成一个"目录",AI 就可以用 grep 搜精确字符串、用 cat 读整页内容、用 find 遍历结构。
之前用真沙箱的方案(给每个用户起一个微型虚拟机),按 Mintlify 月均 85 万次对话的量算,一年光计算成本就要 7 万美元以上。ChromaFs 复用了已有的数据库基础设施,这笔钱省了。
grep 是最难虚拟化的命令。如果真让它逐文件扫描,走网络 IO 会很慢。ChromaFs 的做法是先把 grep 的参数解析出来,用 Chroma 的元数据查询做粗筛,找出可能命中的文件批量预取到缓存里,再让 just-bash 在内存中做精确匹配。
权限控制也很优雅:初始化时根据用户身份裁剪文件树,没权限的路径直接从树里删掉,AI 连路径都看不到,不存在越权风险。
所有写操作一律返回"只读文件系统"错误,AI 能随便看但改不了任何东西,整个系统无状态,不用担心清理和数据污染。
这篇文章在 Hacker News 上引发了一个有意思的讨论。好几位开发者指出,大家不知不觉中把 RAG(检索增强生成)等同于了向量搜索,但 RAG 里的 R 是 Retrieval(检索),本来可以是任何方式:全文搜索、SQL 查询、甚至翻电话簿。把 RAG 绑死在向量数据库上,是早期技术路径的惯性。
有人解释了这种惯性的由来:RAG 概念流行的时候,大模型还不太会用工具,多轮搜索和纠错能力也差,向量检索是当时最省事的方案。现在模型的工具调用和推理能力上来了,让 AI 自己决定用什么方式找信息,反而比预设一条检索管道更灵活。
也有人提出了务实的质疑:Mintlify 的场景是结构化的技术文档,天然适合文件系统隐喻,但如果是组织内部那种乱七八糟、没有层级结构的知识库,这套方案未必好使。
这个方向和 Claude Code 的做法有相通之处:与其把所有信息预检索好喂给模型,不如给模型一套探索工具,让它自己决定看什么、怎么找。对于正在搭建 AI 文档助手或内部知识库的开发者来说,Mintlify 的这套方案提供了一个向量检索之外的选项,尤其适合文档结构清晰、对精确匹配要求高的场景。

Dens Sumesh@densumesh
中文

关于读书,可以拉出两个极端:
一端是「古法阅读」,打开一本纸书,从头到尾阅读,时不时前后翻看,关联对比,思考联想。读的过程,本身就是在冲刷自己大脑神经网络。
一端是「AI 阅读」,PDF 或者书名丢给一个Prompt/skill,瞬间获得各种视角的解读、提炼。这些结果,与自己「古法阅读」半天记录的收获完全一致,甚至更加全面深刻。
曾经我以为这是一个光谱,不走极端,两种方式结合一下就好了。但实践过程中,后者的吸引力实在太强了,我找书的速度甚至都赶不上它生成解读的速度,我连阅读解读的精力都快不够了,何谈「两者结合」?
观察了自己的这种状态有阵子了,发现大脑确实被这种读法给影响了,AI 带来的新、快、全、深,确实有它的好处,但硬币的反面,丧失了「通过读这个动作,冲刷大脑神经网络的体验过程」,总觉得那些「道理」和「知识」只在我的大脑表面「趴着」,一阵风就能把它们吹走。
最近摸索的解法,给自己设原则:每天必须读一小时纸书。
让自己「慢」下来,重新进入读的「浸泡感」当中,时不时会沉浸其中,一抬头,一本书已经读完了,再去与AI 对话讨论该书,快慢相合,感觉那些「道理」又重新长在脑子里了。
诸君可以一试。
中文

@wangwatchworld 没必要舔,相互需要,相互对对方有价值而已。都有点主体性思考问题会更好。您这个观点好在美国本位主义,而不是双方平等的博弈关系。
中文

中国人唯一要感谢的是美国。
你不要管美国现在怎么打压你,怎么算计你。
如果美国不曾开放市场,欧日不会跟进。
过去上百年,美国是唯一一个没侵害过中国的国家。
朝鲜战争是中国凑上去打的,被斯大林狠狠坑了一把,遗憾的是中美因此失去对方。
驼峰航线是一群有勇气的美国人开辟的,没有美国人,中国早亡国了。
至于现在美国搞你,这都是生意,正大光明的竞争而已。
美国算得上正人君子。
王海滨的财经闲谈@wangwatchworld
我在困难时有人跑来借给我钱? 您觉得这个世界突然变天堂了,是吗? 我在困难时,是绝对不会有任何人借给我钱的,我经历过破产的,请不要反驳。 我在"穷鬼"状态下,曾有人“送”给我钱,是因为我创立了一家大数据公司,天使投资人看中了前景。 就像我曾经讲过,你们当年都不要战争赔款,蒋毛都不要,装圣母,那就以后别谈仇恨。 同样的,日本以贷款和少量援助换市场,就别谈感恩戴德。 一群屌毛!
中文









