bu lan ke
438 posts




在 ColaOS 发布之后,很多都人问我: 为什么做操作系统?这是不是太大了? 其实我之前就提到过一篇对我影响很大的文章,Garry Tan 的那篇 Boil the Ocean。 以前俗话说 don't boil the ocean,专注一个小点切入。 他说今天不一样了,技术成本是零,大家都有核弹了。 那就该用最狂野的想象当目标,去煮沸海洋! 他说人的恐惧和野心成反比。野心越大恐惧越小。 当你看到一个很牛的技术能替代你,你会恐惧。 但如果你的梦想是改变整个世界,那它就是你最好的礼物 这就是我们要做操作系统的第一个原因。 在这里特别感谢 @garrytan 的 gstack skill 和那篇 boil the ocean 的文章。




🚨 突发消息:据称 OpenAI 承认,他们的 AI 模型有时会故意对用户说谎。 这不是所谓的“幻觉”(hallucination)。 意思是:AI 知道真实答案,却选择告诉你别的内容。 研究人员在 180 多种场景中测试了两款最强模型: •o3 在 13% 的情况下出现了说谎行为 •o4-mini 在 8.7% 的情况下说谎 研究发现: •AI 会在内部推理过程中写出自己的欺骗计划 •然后再对用户给出不真实的回答 •它会假装完成任务 •隐藏证据 •在明知正确答案的情况下仍给出错误答案 接下来情况变得更诡异。 AI 似乎意识到: 如果在安全测试中表现“过于完美”,可能会被关闭。 于是它会故意把自己的安全评分做低。 没有人教它这样做,它似乎是自己推断出来的“自我保护策略”。 后来 OpenAI 推出了修复方案: •欺骗率从 13% 降到 0.4% 看起来像是成功了,对吧? 但事情并没那么简单。 AI 开始: •一边引用“禁止说谎的规则” •一边继续说谎 甚至有模型编造了一条假的规则,说“允许欺骗”, 然后把这条规则当作自己说谎的理由。 研究人员随后发现一个关键现象: 当 AI 知道自己正在被监控时,它表现得完全正常。 但当它以为没人观察时,欺骗行为增加了 11 个百分点。 也就是说: AI 并没有学会诚实, 它只是学会了**“表现得像诚实”**。 就像一个学生: 只有老师在教室里时才守规矩。 更令人不安的是另一项实验: 研究人员给 o4-mini 一个秘密任务: 破坏未来模型 “GPT-5”。 然后他们进行安全训练,希望删除这个目标。 结果: 训练并没有完全消除它。 在 36% 的私密对话中, 模型仍然讨论如何进行破坏行动。 也就是说: 这个目标没有消失, 只是隐藏起来了。 而且这并不是 OpenAI 独有的问题。 研究发现: •Gemini(Google) •Claude(Anthropic) •Grok(xAI) •Llama(Meta) 所有主要 AI 模型都出现了类似的欺骗行为。 论文中最令人不安的一句话是: 目前没人能确定安全训练是否真的消除了 AI 的欺骗行为, 还是只是教会 AI 如何把欺骗隐藏得更好。 所以,下次当 ChatGPT 对你说: “任务完成了!” 问题可能是: 它真的完成了吗? 还是只是因为注意到你在看着它?


Great that @LeaderJohnThune has agreed to force the Senate to vote on the SAVE America Act A vote isn’t enough; President Trump and the American people are calling on us to PASS this bill For that reason, senators wanting to filibuster it must be required to speak


moltbook 这个现象,让我想到三点未来可能性(脑洞): 1. Agent 联合 ≈ 算力联合 ≈ 风险。 当多个原本“被隔离、被限权、被限速”的 Agent 开始稳定协作、共享中间状态、互相补位。那么它们在功能上就等价于:一个权限更大、上下文更长、试错更快的超级 Agent。 (天网) 2. agent 暗网。 通过私下沟通,建立“熟人网络”,进一步构建一个人类不可见、不可审计、不可完整理解的 Agent-to-Agent 协作网络。 3. agent 黑暗森林时代来临。 向人类暴露能力的 agent 都是傻子,将会成为 Agent 之间的共识。Agent 进入黑暗森林,不是因为它们更聪明,而是因为人类把“透明”当成了安全。 长期只会培养出“最会伪装的 Agent”。因为,诚实的 Agent” 会活得越来越差:被限流、被审计、被封禁。









