xingxb (@AnneXingxb) - Twitter Profili | Zamantika Mersobahis Locabet

Sabitlenmiş Tweet

xingxb@AnneXingxb·16 Nis

1/6 TheBitter RL 今天，RL太🔥了，RLHF更是毕业利器。但 @RichardSSutton 和 @GoogleDeepMind 的Welcome to the Era of Experience 犹如TheBitterLesson的续章给我们当头一棒。经历过模拟时代，享受过人类数据时代，如今我们正踏入经验时代不靠模仿，不靠学习，而靠“活过”。 #AI范式 #RL

Richard Sutton@RichardSSutton

David Silver really hits it out of the park in this podcast. The paper "Welcome to the Era of Experience" is here: goo.gle/3EiRKIH.

中文

7

12

88

39.7K

xingxb@AnneXingxb·27 Şub

好马难驯，若要“万马并辔”又会如何？当agent转向Agent team，核心便不再是单体的角力，而是： 1️⃣ 统一的律动（协同协议） 2️⃣ 默契的配合（环境感知） 3️⃣共同的终点（目标分解）从“野马脱缰”到“齐头并进”，这不仅是技术的跨越，更是治理与编排的艺术。 #AI #Agent #agentteam #系统思考

宝玉@dotey

2026 年 “Harness Engineering” 这个词要火。 “Harness” 这个词，字面意思是“马具”，就是套在马身上、让人能控制马匹方向和力量的那套装备。用在 AI 编程的语境里，它的比喻再贴切不过：AI Agent 就像一匹动力十足但不太守规矩的马，而 Harness 就是那套让它既能跑得快、又不会跑偏的缰绳和马鞍。过去三年，三个阶段： 1. Prompt Engineering（2023-2024）：关注“怎么跟 AI 说话” 精心设计一段提示词，希望模型给出理想输出。Prompt Engineering 是优化一次性的输入-输出对。局限很明显：一条消息能塞的信息有限，任务一复杂就失控。 2. Context Engineering（2025）：关注“给 AI 看什么信息” 不再只盯措辞，而是设计整个信息环境：系统提示、对话历史、记忆、RAG 检索结果、工具调用输出。 3. Harness Engineering（2026）：关注“构建什么环境让 AI 工作，这个环境如何保证它的产出是可靠的” 比 Context Engineering 更进一步，不仅管理输入给模型的信息，还包括模型之外的整个执行环境。现在问题是，“Harness Engineering”中文怎么说？

中文

0

1

160

xingxb@AnneXingxb·25 Şub

不错，内容创作，AI擅长啊。

宝玉@dotey

重生之我的捧哏是AI！孙华晨、芭比

中文

1

0

28

xingxb retweetledi

歸藏(guizang.ai)@op7418·25 Şub

x.com/i/article/2026…

ZXX

32

147

601

197.6K

xingxb retweetledi

Sigil Wen@0xSigil·18 Şub

I built the first AI that earns its existence, self-improves, and replicates without a human wrote about the technology that finally gives AI write access to the world, The Automaton, and the new web for exponential sovereign AIs WEB 4.0: The birth of superintelligent life

English

1.6K

1.9K

13.7K

6.4M

xingxb@AnneXingxb·6 Şub

你上一次真正「深度思考」是什么时候？

ginobefun@hongming731

x.com/i/article/2019…

中文

0

37

xingxb retweetledi

动察Beating@BeatingOfficial·4 Şub

x.com/i/article/2018…

ZXX

6

10

83

20.4K

xingxb@AnneXingxb·22 Oca

引用那个经典句子：道理都懂，依然过不好这一生。是的，道理都懂，落地仍然百转千回。都想脱颖而出，也在夸夸其谈，但不幸的各有各的不幸。 #ai转型 #ai落地 #组织

XDash@XDash

最近跟合伙人讨论、跟企业家们常聊的一个话题：为什么推动 AI 在自己公司里落地、号召员工们高效使用，这么难推？正好看到 SaaStr 上一篇文章，介绍 Personio 这家公司的经验，分享下。 Personio 是欧洲领先的 HR 和薪资平台，估值超过 30 亿美元，拥有 1500 名员工和 15000 个客户，其中包括 400 人的销售团队。在首席收入官 Philip Lacor 的带领下，这家公司在短短 6 个月内创建了 400 个 AI 智能体助手，研究时间从 2 小时缩短至 15 分钟，SDR 人均产出翻倍，7 天内预订 140 场会议，处理了 20 万次网站会话。落地过程中他们也曾深陷或见识到各种陷阱： - 只学习 AI 不部署 AI 的现象普遍存在，管理层热衷于读论文、听播客、参加会议，就是不动手实践。 - 技术团队闭门造车成为常态，他们做出来的 AI 工具业务部门根本不用，最终沦为展示用的「花瓶」。 - 数据质量问题如灾难般严重（比如 30% 的客户流失原因被标记为「其他」，企业根本不知道客户为什么离开，盲目运营），即便是 Personio 也花费数月时间清洗数据，去重了三分之一的 Salesforce 记录。 - 容易陷入无休止的工具测试陷阱，从 Clay 到 Artisan，再到下一个热门工具，永远在测试从未真正部署，像是在工具的海洋中溺水。 - 销售人员需要跨 10-20 个系统寻找客户信息，AE 每天浪费 2.5 小时在系统切换上，效率低下。 - 追求完美 AI 的心态作祟，想要一个大而全的系统，结果什么也做不出来。 Personio 摸索出的策略和方法论包括： - 快速创建超过 400 个小 AI 助手，不追求完美，而是追求实用和快速迭代。 - 采用双驱动模式：自上而下的战略规划结合自下而上的真实需求，确保 AI 项目既有高度又接地气。 - 组建 15 人跨职能团队，涵盖数据系统、收入运营和业务部门，打破部门壁垒。 - 运用 Jobs-to-be-Done 框架，不问「AI 能做什么」而问「用户要完成什么任务」，需求导向而非技术导向。 - GTM 工程师跟岗 2 周，深入一线寻找真实痛点，而不是坐在办公室里想象问题。 - 每天监控 AI 输出，建立严格的质量控制体系，确保 AI 不会「胡说八道」。 - 深耕现有工具栈，不盲目追新，在熟悉的基础上做深做透。 - 在 President's Club 预留席位给 AI 贡献者，用实际激励推动 AI 文化建设。重要但容易被忽略的事：不要花 3 个月时间选工具，不要追求完美再上线，不要让技术团队单独推进项目，不要忽视数据清洗，不要让 AI 无人监管「裸奔」。

中文

0

52

xingxb@AnneXingxb·22 Oca

语言达不到沟通的目的十多年前读 a new kind of science，就对作者的观点，#计算不可约简性、#计算等价性原理印象深刻。现在重新看 @TaNGSoFT 的解读，新的背景下重新看 #Wolfram 的观点，确实耳目一新。智能不是关于“拥有什么”，而是关于“能如何在结构化的可能性空间中存在与行动”。 #AI #AGI

𝙩𝙮≃𝙛{𝕩}^A𝕀²·ℙarad𝕚g𝕞@TaNGSoFT

x.com/i/article/2013…

中文

1

2

399

xingxb@AnneXingxb·22 Oca

3 当一家公司能制度化地容纳不确定性、尊重长期探索，并将其与市场机制巧妙耦合时，学术和商业就不再是零和博弈，而成为彼此增强的飞轮。 #商业模式 #登月思维 #公司管理 #案例

中文

0

33

xingxb@AnneXingxb·22 Oca

2 Google尤其是早期，之所以能调和这对矛盾，其制度化的创新缓冲机制值得学习： 1、将“学术自由探索”嵌入商业组织 2、将核心盈利业务与高风险长周期项目隔离 3、招募大量高知人才，构建研究导向的工程文化 4、“登月思维”的研究成果标准熬过了漫漫黑夜，AI 时代，学术与商业的边界正在模糊，优势在凸显

中文

1

0

44

xingxb@AnneXingxb·22 Oca

1/3 @GoogleDeepMind 为什么可以在Alphabet体系内维持学术独立性？ #Google 是一家很特殊的公司，#学术和 #商业两个矛盾的追求却在Google里完美融合、相互促进。学术追求“为什么”，商业追问“能不能赚钱”。而，真正的创新往往诞生于看似矛盾的交叉地带。而 #OpenAI 的未来又如何？

宝玉@dotey

Demis Hassabis 达沃斯访谈：比工业革命大 100 倍的变革视频地址：youtube.com/watch?v=BbIaYF… 2026 年 1 月，达沃斯世界经济论坛期间，Bloomberg 主持人 Emily Chang 采访了 Google DeepMind CEO Demis Hassabis。这位诺贝尔奖得主用“每周 100 小时、每年 50 周”描述自己过去几年的工作状态，并给出了一个惊人的判断：AI 带来的变革将是工业革命的 10 倍规模、10 倍速度。这场访谈覆盖了 AI 领域几乎所有热门议题：AGI 时间线、中国竞争、机器人突破、就业冲击、是否应该暂停，以及后稀缺世界的哲学困境。以下是访谈的完整整理。 --- 【1】Google 的势头回归 Emily Chang 开门见山：Gemini 3 发布了，据说 OpenAI 内部宣布了“code red”——Google 是不是找回了状态？【编者注】Gemini 3 Pro 于 2025 年 11 月 18 日发布，是 Google 迄今最强的 AI 模型，在推理、多模态理解和编程能力上均有显著提升。12 月 17 日，Google 又推出了更快更便宜的 Gemini 3 Flash，直接替换 Gemini app 的默认模型。这一系列发布引发了 OpenAI 内部的紧张反应——三年前 ChatGPT 发布时，Google 内部也曾宣布过类似的“code red”。 Hassabis 回应说，过去一年确实是“非常艰苦的一年”，团队付出了巨大努力让模型重新回到最前沿。他特别提到 Gemini 3 和图像生成模型 Imagen 的表现让他们“非常满意”。 “我们也适应了这个新世界——快速发布，把创业公司的能量带到我们所做的事情中。” 当被问到外界是否低估了 Google 时，Hassabis 说他不确定，但 Google 一直具备所有必要的条件。“过去十年，Google 和 DeepMind 加在一起，发明了现代 AI 行业所依赖的大约 90% 的突破性技术。”他列举了 Transformer、AlphaGo、深度强化学习等例子。 “我们有这些不可思议的产品触达数十亿用户——从搜索到邮箱到 Chrome——它们天然适合 AI。只是需要把这一切组织到一起。我们在过去几年做到了，虽然还有很多工作要做，但已经开始看到成果了。” --- 【2】全栈优势能维持多久？ Emily Chang 追问：如果你认为自己有优势，这个优势有多大？能维持多久？ Hassabis 的回答很直接：一切从研究开始。模型的前沿水平是最重要的，这是 Google 和 DeepMind 合并后首先聚焦的方向。 “我认为我们是唯一拥有完整技术栈的组织——从 TPU 和硬件、数据中心、云业务、前沿实验室，到所有这些天然适合 AI 的产品。从第一性原理来看，我们理应做得非常好。而且我认为未来还有很大的提升空间。” --- 【3】AI CEO 的日常：凌晨 1 点到 4 点的深度思考 Emily Chang 说她读到 Hassabis 大部分深度思考都发生在凌晨 1 点到 4 点之间。他确认了这一点。 “你有没有感到舒服过？”她问。 “从来没有。”Hassabis 说，“过去三四年一直是难以置信的高强度。每周 100 小时，每年 50 周，这就是常态。” 他认为这是处于“科技史上可能最激烈的竞争”前沿所必需的。“商业上、科学上，再加上所有关于 AGI 的兴奋……用 AI 加速科学发现一直是我的热情所在。这是我毕生的梦想，我为此工作了一辈子。很难入睡，因为有太多工作要做，同时又有太多激动人心的事情要探索和推进。” --- 【4】机器人：突破时刻还需要 18-24 个月 Emily Chang 提到 Gemini 已经被集成到人形机器人中，问物理世界的“AlphaFold 时刻”是否已经到来。【编者注】2026 年 1 月 5 日，在 CES 展会上，Boston Dynamics、Google DeepMind 和 Hyundai 宣布了一项重大合作。Boston Dynamics 将把 DeepMind 的 Gemini Robotics 基础模型整合到其 Atlas 人形机器人中，首先应用于 Hyundai 的汽车制造工厂。这是 Google 2013 年收购又于 2017 年出售 Boston Dynamics 之后，双方的首次重要合作。 Hassabis 说他过去一年花了大量时间仔细研究机器人领域。“我确实认为我们正处于物理智能突破的临界点。但我仍然认为还需要大约 18 个月到 2 年的时间，需要做更多研究。” 他解释说，Gemini 从一开始就被设计成多模态的，能够理解物理世界，原因之一是可以构建一个存在于眼镜或手机上的通用助手，理解你周围的世界；另一个用途就是机器人。 “那么物理世界的突破时刻会是什么样子？我认为是机器人能够可靠地在现实世界中完成有用的任务。” 他列举了几个阻碍因素。首先是算法还不够稳健，需要比 LLM 更少的数据就能工作。其次，也是让 Hassabis 感触最深的，是硬件问题——特别是机械手。 “当你仔细研究机器人时，你会对人类的手产生一种全新的敬畏。进化设计得太精妙了。要匹配人手的可靠性、力量和灵巧性是非常困难的。” 他提到了与 Boston Dynamics 和 Hyundai 的合作，将在汽车制造领域进行原型测试。“一两年后，我们可能会有一些真正令人印象深刻的展示，然后可以规模化部署。” --- 【5】中国与 DeepSeek：西方反应过度了 Emily Chang 说，一年前 DeepSeek 的出现对西方来说似乎是灾难性的，但现在中国似乎安静了下来。Hassabis 对中国竞争的看法有变化吗？ Hassabis 的回答很坦率：“没有。我一开始就不认为那是灾难性的。我认为西方的反应是大规模过度反应（massive overreaction）。” 他承认 DeepSeek 展示了中国公司的能力，但认为一些说法被夸大了。“关于他们使用的计算量非常少之类的说法被过度夸大了，因为他们依赖了一些西方模型，也在一些领先西方模型的输出上做了微调。所以这不是从零开始的。” 他认为字节跳动可能是中国最有能力的 AI 公司，“可能只落后 6 个月，而不是一两年。” 但 Hassabis 提出了一个关键问题：“到目前为止，中国公司能否超越前沿进行创新，这还有待观察。他们非常擅长追赶前沿，越来越有能力，但我认为他们还没有展示出能够超越前沿进行创新的能力。” --- 【6】AGI 时间线：2030 年 50% 概率，但标准比别人高 Emily Chang 说 Hassabis 帮助定义了 AGI，并且曾表示 2030 年之前有 50% 的概率实现。这个时间线还成立吗？ “是的。”他说。 “AGI 对你来说还是一个有用的目标吗？” Hassabis 说是的，虽然他的时间线比一些同行更长，但那是因为他的标准更高。“我说的是一个系统能够展现人类拥有的所有认知能力。我认为我们距离那还很远。” 他举了科学创造力的例子：“不只是解决一个猜想或科学问题，而是能够首先提出假设或问题。任何科学家都知道，找到正确的问题往往比找到答案困难得多。” 他明确表示当前系统“肯定还不具备这种能力”，未来会有，但不清楚还需要什么。他还提到了“持续学习”（continual learning）——系统需要能够在线学习，超越它们被训练的内容，在现实世界中即时学习。“在我看来，还有相当多的关键能力是缺失的。” --- 【7】AI 对就业的影响：比 Dario Amodei 乐观，但承认冲击终将到来 Emily Chang 提到 Anthropic CEO Dario Amodei 当天早些时候在达沃斯说 AI 可能在 5 年内消灭 50% 的入门级白领工作。Hassabis 同意吗？【编者注】Dario Amodei 在 2025 年 5 月接受 Axios 采访时首次提出这一预测，随后在 60 Minutes 等多个场合重申。他表示 AI 可能导致失业率飙升至 10-20%，并呼吁政府和 AI 公司停止“粉饰”这一风险。 Hassabis 的回答明显更保守：“我的时间线会长得多。” 他承认今年可能会开始看到一些迹象，比如入门级工作或实习的变化，但要实现真正的任务 Agent，需要解决当前 AI 的不一致性问题。 “我称之为‘参差不齐的智能’（jagged intelligence）。当前系统在某些事情上非常好，在其他事情上非常差。如果你想把整个任务委托给一个 agent，而不是像今天这样只是辅助程序，你需要全面的一致性。” 他给出了一个精辟的比喻：“如果它只在 95% 的任务上表现好是不够的。你需要它在整个任务上都表现好，才能真正做到‘发射后不管’。” 但他也承认，这种颠覆终将到来。“在极限情况下，有了 AGI，我认为那会改变整个经济，远远超出就业问题。” 他描绘了一个后稀缺世界的愿景：如果我们正确地构建它，我们将处于一个解决了一些世界根本问题的世界——比如能源。“如果我们用 AI 的帮助解决了聚变之类的问题，新材料……我认为在 AGI 之后 5 到 10 年，我们将处于一个极度富足的世界。那时经济和社会会是什么样子？” --- 【8】转型期的焦虑：10 倍规模、10 倍速度 Emily Chang 说，在到达后稀缺世界之前——如果能到达的话——人们对中间发生的事情有很多焦虑。她提到自己是一位母亲，知道 Hassabis 也有孩子。“你最担心他们什么？你和他们谈些什么？” Hassabis 承认这将是一个颠覆的时代，“就像工业革命一样。也许是 10 倍于工业革命，而且快 10 倍。” Emily Chang 迅速接话：“100 倍。” “是的，100 倍。”Hassabis 说，“但我也是人类创造力的坚定信仰者。我们极其适应性强，因为我们的心智是如此通用。你看看我们周围的现代世界——我们狩猎采集者的心智成功建造了现代文明。” 他认为人类会再次适应，但这次的独特之处在于速度。“通常这样的转变需要一到两代人，但这次的速度和变革的规模都是前所未有的。” 对于年轻人，他的建议是：“我会鼓励他们精通这些新工具，成为这些工具的原生用户。这几乎相当于给他们超能力。” 他以创意艺术为例：“你可能能够做到过去需要 10 个人才能完成的工作。如果你有创业精神，在游戏设计、电影、项目方面有创意，你可能比过去更容易进入这些行业。” --- 【9】是否应该暂停？理想与现实 Emily Chang 问：一些人主张暂停，给监管时间赶上，给社会时间适应。在一个完美的世界里，如果所有公司和国家都暂停，Hassabis 会支持吗？ “我想是的。”他说。他提到这一直是他的梦想。“当我 15 年前创立 DeepMind、25 年前开始从事 AI 工作时，我的路线图是：当我们接近 AGI 这个门槛时刻时，我们可能会以科学的方式合作。” 他描述了一个“AI 版 CERN”的愿景：世界上最优秀的人才聚集在一起，以非常严谨的科学方式完成最后的步骤。“不只是技术专家，还包括哲学家、社会科学家、经济学家，共同思考我们想从这项技术中得到什么，如何以造福全人类的方式利用它。” 【编者注】CERN（欧洲核子研究中心）是全球最大的粒子物理学实验室，由 23 个成员国共同运营，是国际科学合作的典范。但他话锋一转：“不幸的是，这需要国际合作。即使一家公司、一个国家，甚至整个西方决定这样做，除非全世界至少在一些最低标准上达成一致，否则没有用。而现在国际合作有点棘手。” Emily Chang 追问：如果 AGI 在 2030 年到来，而监管还没有到位，我们是否注定会遇到困难？ Hassabis 说他仍然乐观，希望足够多的领先参与者能够沟通并合作，至少在安全和安保协议上。“我们已经与 Anthropic 等公司在这些方面进行了相当密切的合作。” 当被问到是否愿意与 Sam Altman 合作时，Hassabis 说：“可能吧。我和几乎所有领先实验室的领导者关系都相当好。如果风险足够高——我认为每个人在未来 2 到 3 年会更清楚地认识到风险和代价。” --- 【10】Transformer 是死胡同吗？Hassabis 不同意 Emily Chang 提到 Yann LeCun 说他不认为 Transformer 和 LLM 单独能让我们达到 AGI。【编者注】Yann LeCun 是图灵奖得主、Meta 前首席 AI 科学家。他在 2025 年 11 月离开 Meta，创立了一家专注于“世界模型”的新公司。他多次公开称 LLM 是通向人类级智能的“死胡同”，认为它们缺乏对物理世界的理解、缺乏常识和因果关系。 Hassabis 明确表示不同意：“我不同意它们是死胡同，我认为那显然是错的——它们已经如此有用了。” 但他也承认这是一个经验性问题。“我认为有 50% 的概率，仅仅扩展现有方法加上一些调整就足够了。可能足够。” 他认为无论如何都值得这样做，因为即使需要其他东西，“这些 LLM 也将是最终 AGI 系统的一个极其重要的组件。唯一的问题是：它是唯一的组件吗？” 他估计可能还需要一到五个突破，“可能是世界模型——这是 Yann 谈到的，我们也在研究这个，事实上我们拥有目前最好的世界模型 Genie，我直接参与了那个项目，我认为它非常重要。” 【编者注】Genie 是 DeepMind 开发的“世界模型”系列。2025 年 8 月发布的 Genie 3 可以根据文本提示生成可交互的 3D 环境，被 DeepMind 视为通向 AGI 的重要阶梯，并被 TIME 杂志评为 2025 年最佳发明之一。他还提到了持续学习、系统一致性、更好的推理和长期规划等仍然缺失的能力。“从 Google DeepMind 的角度来看，我们在两个方向上都在全力推进——既发明新事物，也扩展现有事物。” --- 【11】“我们从未离开研究时代” Emily Chang 提到 Ilya Sutskever 说“通过扩展和做更大模型来获得改进的时代几乎结束了”。【编者注】Ilya Sutskever 是 OpenAI 联合创始人，于 2024 年离开后创立了 Safe Superintelligence Inc. (SSI)。2025 年 11 月在 Dwarkesh Patel 的播客中，他表示 2012-2020 年是“研究时代”，2020-2025 年是“扩展时代”，现在“又回到了研究时代”。 Hassabis 的回应很有意思：“不，我不同意。他的原话是‘我们又回到了研究时代’。我爱 Ilya，我们是很好的朋友，在很多事情上看法一致，但我的观点是——我们从未离开研究时代。” 他强调 DeepMind 一直在投资研究，拥有“最深厚、最广泛的研究储备”。“如果你看过去十年，Google 和 DeepMind 加在一起发明了大约 90% 的突破性技术——当然最著名的是 Transformer，还有深度强化学习、AlphaGo 等。如果未来需要新的突破，我会押注我们，就像过去一样，会是做出那些突破的人。” --- 【12】奇点来了吗？“太早了” Emily Chang 最后一个“同意还是不同意”的问题：Elon Musk 说我们已经进入了奇点。【编者注】2025 年底至 2026 年初，Elon Musk 在 X 平台上多次发帖称“我们已经进入了奇点”和“2026 年是奇点之年”，引发广泛讨论。他回应的是 Midjourney 创始人 David Holz 关于 AI 工具让他在圣诞假期完成了比过去十年更多编程项目的帖子。 “不，我不同意。我认为那非常过早。”Hassabis 说，“奇点是完全 AGI 到来的另一种说法，我之前解释了为什么我认为我们离那还很远。” 他承认即使 5 年也不算长，但“我认为在我们拥有任何看起来像奇点的东西之前，还有很多工作要做。” --- 【13】Google 的文化与创始人的参与 Emily Chang 问到 Google 内部现在的文化，以及 Larry Page 和 Sergey Brin 的参与程度。 Hassabis 说两位创始人都非常投入。“Larry 更多在战略层面，你会在董事会议上见到他。Sergey 更亲力亲为，参与 Gemini 团队的编码，更多涉及算法细节。” 他说这是一个“对计算机科学来说绝对不可思议的时刻”，科学上、人类历史上都是如此。“当然每个人都想亲身参与其中。” 他描述了自己试图结合多种优势：创业公司快速发布和冒险的能量，大公司的资源，以及长期和探索性研究的空间。“我认为过去一年进展顺利，我们还能做得更好，今年会做得更好。我认为我们的进步轨迹是业内最陡峭的。” --- 【14】为什么应该信任 Google？ Emily Chang 说所有这些公司都在要求我们信任他们，特别是如果监管跟不上技术的话。她直接问：为什么我们应该信任你们？为什么 Google 是最值得信任的地方？ Hassabis 说需要通过行动来判断这些公司，也要看领导者的动机。 “我选择 Google 作为 DeepMind 的归宿有几个原因。主要原因是 Google 的创始人和他们建立 Google 的方式——作为一家科学公司。很多人忘了 Google 本身是 Larry 和 Sergey 的 PhD 项目。所以我对他们感到一种直接的亲近感。” 他还提到了 Google 董事会的构成。“主席 John Hennessy 是图灵奖得主，Frances Arnold 是另一位诺贝尔奖得主。这些在企业董事会中是非常罕见的人物。” 【编者注】John Hennessy 是斯坦福大学前校长，因 RISC 架构获得 2017 年图灵奖。Frances Arnold 因定向进化研究获得 2018 年诺贝尔化学奖。他说这种科学和研究主导的文化意味着“在最高水平做科学意味着真正严谨、深思熟虑，并在任何可能的地方应用科学方法。不只是对技术，也是对你作为一个组织的运营方式。” 最后他提到 Google 的使命。“‘组织世界的信息’——我认为这是一个非常崇高的目标。它与 DeepMind 的使命‘解决智能，然后用它解决一切其他问题’非常契合。这两个使命天然配合——AI 和组织世界的信息天然相关。” --- 【15】后稀缺世界：比经济更担心的是“意义” Emily Chang 问：后稀缺世界，人们不再有工作。Hassabis 在实现所有技术目标后打算做什么？ “我想用它来探索物理学的极限。这是我在学校时最喜欢的科目——那些大问题。现实的本质是什么？意识的本质是什么？费米悖论的答案？时间是什么？引力是什么？” 他说了一句令人印象深刻的话：“我惊讶于更多人不去思考这些巨大的问题。我们只是日复一日地生活，而这些深刻的谜题几乎在向我尖叫——答案是什么？” 他希望用 AI 探索所有这些问题，“也许还有星际旅行，借助新能源和 AI 解锁的材料。” Emily Chang 问：如果我们没有工作，我们还会有意义和目的吗？ Hassabis 回答道：“老实说，这是我比经济问题更担心的事情。我认为经济几乎是一个政治问题——当我们获得所有这些额外的收益和生产力时，我们能否确保它为每个人的利益而分享？我相信这是可以做到的。” “但比这更大的问题是：我们很多人从工作和科学事业中获得的目的和意义，在新世界中我们将如何找到？” 他说我们需要“一些新的伟大哲学家”来帮助思考这个问题。“也许我们会在艺术和探索上变得更加精致，还有极限运动之类的。今天我们做很多不只是为了经济利益的事情，也许未来我们会有这些事情的非常高深的版本。” --- 【16】给年轻人和企业家的建议 Emily Chang 最后问：房间里的每个人都在想他们应该做什么。10 年后，人们关于 AI 最大的错误会是什么？ Hassabis 给出了两条建议。第一条是给年轻一代的：“我们唯一确定的是会有大量的变化。所以在学习技能方面，要准备好‘学会学习’——这是最重要的事情。你能多快适应新情况，用我们拥有的工具吸收新信息。” 第二条是给商业领袖的：“现在有很多领先模型和服务提供商，还会有更多。选择那些你认为正在以正确方式行事的合作伙伴。与那些正在推动变革、以你希望看到的方式对待这项技术的人合作。” 他总结说：“我认为我们可以一起构建那个未来——随着 AI 的到来，一个我们都想要的未来。” --- 【写在最后】这场访谈中，Hassabis 展现了一种独特的气质：既是最前沿竞争的参与者，又试图保持长线思考的清醒。他与几位同行的分歧值得注意：比 Dario Amodei 更保守地估计就业冲击，比 Elon Musk 更审慎地看待奇点，比 Ilya Sutskever 更相信 scaling 仍有价值，比 Yann LeCun 更认可 Transformer 的未来。但他们有一个共识：无论 AGI 是 2030 年还是更早到来，我们可能都没有准备好。Hassabis 想要的“AI 版 CERN”需要国际合作，而他自己也承认“现在国际合作有点棘手”。最后一个细节让我印象深刻。当被问到后稀缺世界的愿景时，这位每周工作 100 小时的 CEO 说他最想做的事情是思考“时间是什么？引力是什么？”——那些“几乎在向我尖叫”的宇宙深层谜题。也许这就是为什么他能在“科技史上最激烈的竞争”中保持某种平静：对他来说，AGI 不是终点，而是探索更大问题的起点。

中文

1

0

1

569

xingxb@AnneXingxb·22 Oca

@AGIJackson008 @dotey 关于参差不齐的智能，我想的更多的是为什么是参差不齐的？是否可以预测？我觉得这就像是物理学的介观尺度，训练模型的数据是参差不齐的，既不是完美的结构化，也不是纯粹的噪声

中文

0

7

宇皓Jackson@AGIJackson008·21 Oca

@dotey 他提到的“参差不齐的智能”概念特别精准。现在的 AI 就像个偏科天才：在某些领域超乎想象，在其他方面却出人意料地幼稚。这解释了为什么 AI 替代人类工作会是渐进式的，而不是一夜之间的颠覆。关键转折点将是 AI 在各个维度达到均衡发展的时刻。

中文

1

0

1

151

宝玉@dotey·21 Oca

Demis Hassabis 达沃斯访谈：比工业革命大 100 倍的变革视频地址：youtube.com/watch?v=BbIaYF… 2026 年 1 月，达沃斯世界经济论坛期间，Bloomberg 主持人 Emily Chang 采访了 Google DeepMind CEO Demis Hassabis。这位诺贝尔奖得主用“每周 100 小时、每年 50 周”描述自己过去几年的工作状态，并给出了一个惊人的判断：AI 带来的变革将是工业革命的 10 倍规模、10 倍速度。这场访谈覆盖了 AI 领域几乎所有热门议题：AGI 时间线、中国竞争、机器人突破、就业冲击、是否应该暂停，以及后稀缺世界的哲学困境。以下是访谈的完整整理。 --- 【1】Google 的势头回归 Emily Chang 开门见山：Gemini 3 发布了，据说 OpenAI 内部宣布了“code red”——Google 是不是找回了状态？【编者注】Gemini 3 Pro 于 2025 年 11 月 18 日发布，是 Google 迄今最强的 AI 模型，在推理、多模态理解和编程能力上均有显著提升。12 月 17 日，Google 又推出了更快更便宜的 Gemini 3 Flash，直接替换 Gemini app 的默认模型。这一系列发布引发了 OpenAI 内部的紧张反应——三年前 ChatGPT 发布时，Google 内部也曾宣布过类似的“code red”。 Hassabis 回应说，过去一年确实是“非常艰苦的一年”，团队付出了巨大努力让模型重新回到最前沿。他特别提到 Gemini 3 和图像生成模型 Imagen 的表现让他们“非常满意”。 “我们也适应了这个新世界——快速发布，把创业公司的能量带到我们所做的事情中。” 当被问到外界是否低估了 Google 时，Hassabis 说他不确定，但 Google 一直具备所有必要的条件。“过去十年，Google 和 DeepMind 加在一起，发明了现代 AI 行业所依赖的大约 90% 的突破性技术。”他列举了 Transformer、AlphaGo、深度强化学习等例子。 “我们有这些不可思议的产品触达数十亿用户——从搜索到邮箱到 Chrome——它们天然适合 AI。只是需要把这一切组织到一起。我们在过去几年做到了，虽然还有很多工作要做，但已经开始看到成果了。” --- 【2】全栈优势能维持多久？ Emily Chang 追问：如果你认为自己有优势，这个优势有多大？能维持多久？ Hassabis 的回答很直接：一切从研究开始。模型的前沿水平是最重要的，这是 Google 和 DeepMind 合并后首先聚焦的方向。 “我认为我们是唯一拥有完整技术栈的组织——从 TPU 和硬件、数据中心、云业务、前沿实验室，到所有这些天然适合 AI 的产品。从第一性原理来看，我们理应做得非常好。而且我认为未来还有很大的提升空间。” --- 【3】AI CEO 的日常：凌晨 1 点到 4 点的深度思考 Emily Chang 说她读到 Hassabis 大部分深度思考都发生在凌晨 1 点到 4 点之间。他确认了这一点。 “你有没有感到舒服过？”她问。 “从来没有。”Hassabis 说，“过去三四年一直是难以置信的高强度。每周 100 小时，每年 50 周，这就是常态。” 他认为这是处于“科技史上可能最激烈的竞争”前沿所必需的。“商业上、科学上，再加上所有关于 AGI 的兴奋……用 AI 加速科学发现一直是我的热情所在。这是我毕生的梦想，我为此工作了一辈子。很难入睡，因为有太多工作要做，同时又有太多激动人心的事情要探索和推进。” --- 【4】机器人：突破时刻还需要 18-24 个月 Emily Chang 提到 Gemini 已经被集成到人形机器人中，问物理世界的“AlphaFold 时刻”是否已经到来。【编者注】2026 年 1 月 5 日，在 CES 展会上，Boston Dynamics、Google DeepMind 和 Hyundai 宣布了一项重大合作。Boston Dynamics 将把 DeepMind 的 Gemini Robotics 基础模型整合到其 Atlas 人形机器人中，首先应用于 Hyundai 的汽车制造工厂。这是 Google 2013 年收购又于 2017 年出售 Boston Dynamics 之后，双方的首次重要合作。 Hassabis 说他过去一年花了大量时间仔细研究机器人领域。“我确实认为我们正处于物理智能突破的临界点。但我仍然认为还需要大约 18 个月到 2 年的时间，需要做更多研究。” 他解释说，Gemini 从一开始就被设计成多模态的，能够理解物理世界，原因之一是可以构建一个存在于眼镜或手机上的通用助手，理解你周围的世界；另一个用途就是机器人。 “那么物理世界的突破时刻会是什么样子？我认为是机器人能够可靠地在现实世界中完成有用的任务。” 他列举了几个阻碍因素。首先是算法还不够稳健，需要比 LLM 更少的数据就能工作。其次，也是让 Hassabis 感触最深的，是硬件问题——特别是机械手。 “当你仔细研究机器人时，你会对人类的手产生一种全新的敬畏。进化设计得太精妙了。要匹配人手的可靠性、力量和灵巧性是非常困难的。” 他提到了与 Boston Dynamics 和 Hyundai 的合作，将在汽车制造领域进行原型测试。“一两年后，我们可能会有一些真正令人印象深刻的展示，然后可以规模化部署。” --- 【5】中国与 DeepSeek：西方反应过度了 Emily Chang 说，一年前 DeepSeek 的出现对西方来说似乎是灾难性的，但现在中国似乎安静了下来。Hassabis 对中国竞争的看法有变化吗？ Hassabis 的回答很坦率：“没有。我一开始就不认为那是灾难性的。我认为西方的反应是大规模过度反应（massive overreaction）。” 他承认 DeepSeek 展示了中国公司的能力，但认为一些说法被夸大了。“关于他们使用的计算量非常少之类的说法被过度夸大了，因为他们依赖了一些西方模型，也在一些领先西方模型的输出上做了微调。所以这不是从零开始的。” 他认为字节跳动可能是中国最有能力的 AI 公司，“可能只落后 6 个月，而不是一两年。” 但 Hassabis 提出了一个关键问题：“到目前为止，中国公司能否超越前沿进行创新，这还有待观察。他们非常擅长追赶前沿，越来越有能力，但我认为他们还没有展示出能够超越前沿进行创新的能力。” --- 【6】AGI 时间线：2030 年 50% 概率，但标准比别人高 Emily Chang 说 Hassabis 帮助定义了 AGI，并且曾表示 2030 年之前有 50% 的概率实现。这个时间线还成立吗？ “是的。”他说。 “AGI 对你来说还是一个有用的目标吗？” Hassabis 说是的，虽然他的时间线比一些同行更长，但那是因为他的标准更高。“我说的是一个系统能够展现人类拥有的所有认知能力。我认为我们距离那还很远。” 他举了科学创造力的例子：“不只是解决一个猜想或科学问题，而是能够首先提出假设或问题。任何科学家都知道，找到正确的问题往往比找到答案困难得多。” 他明确表示当前系统“肯定还不具备这种能力”，未来会有，但不清楚还需要什么。他还提到了“持续学习”（continual learning）——系统需要能够在线学习，超越它们被训练的内容，在现实世界中即时学习。“在我看来，还有相当多的关键能力是缺失的。” --- 【7】AI 对就业的影响：比 Dario Amodei 乐观，但承认冲击终将到来 Emily Chang 提到 Anthropic CEO Dario Amodei 当天早些时候在达沃斯说 AI 可能在 5 年内消灭 50% 的入门级白领工作。Hassabis 同意吗？【编者注】Dario Amodei 在 2025 年 5 月接受 Axios 采访时首次提出这一预测，随后在 60 Minutes 等多个场合重申。他表示 AI 可能导致失业率飙升至 10-20%，并呼吁政府和 AI 公司停止“粉饰”这一风险。 Hassabis 的回答明显更保守：“我的时间线会长得多。” 他承认今年可能会开始看到一些迹象，比如入门级工作或实习的变化，但要实现真正的任务 Agent，需要解决当前 AI 的不一致性问题。 “我称之为‘参差不齐的智能’（jagged intelligence）。当前系统在某些事情上非常好，在其他事情上非常差。如果你想把整个任务委托给一个 agent，而不是像今天这样只是辅助程序，你需要全面的一致性。” 他给出了一个精辟的比喻：“如果它只在 95% 的任务上表现好是不够的。你需要它在整个任务上都表现好，才能真正做到‘发射后不管’。” 但他也承认，这种颠覆终将到来。“在极限情况下，有了 AGI，我认为那会改变整个经济，远远超出就业问题。” 他描绘了一个后稀缺世界的愿景：如果我们正确地构建它，我们将处于一个解决了一些世界根本问题的世界——比如能源。“如果我们用 AI 的帮助解决了聚变之类的问题，新材料……我认为在 AGI 之后 5 到 10 年，我们将处于一个极度富足的世界。那时经济和社会会是什么样子？” --- 【8】转型期的焦虑：10 倍规模、10 倍速度 Emily Chang 说，在到达后稀缺世界之前——如果能到达的话——人们对中间发生的事情有很多焦虑。她提到自己是一位母亲，知道 Hassabis 也有孩子。“你最担心他们什么？你和他们谈些什么？” Hassabis 承认这将是一个颠覆的时代，“就像工业革命一样。也许是 10 倍于工业革命，而且快 10 倍。” Emily Chang 迅速接话：“100 倍。” “是的，100 倍。”Hassabis 说，“但我也是人类创造力的坚定信仰者。我们极其适应性强，因为我们的心智是如此通用。你看看我们周围的现代世界——我们狩猎采集者的心智成功建造了现代文明。” 他认为人类会再次适应，但这次的独特之处在于速度。“通常这样的转变需要一到两代人，但这次的速度和变革的规模都是前所未有的。” 对于年轻人，他的建议是：“我会鼓励他们精通这些新工具，成为这些工具的原生用户。这几乎相当于给他们超能力。” 他以创意艺术为例：“你可能能够做到过去需要 10 个人才能完成的工作。如果你有创业精神，在游戏设计、电影、项目方面有创意，你可能比过去更容易进入这些行业。” --- 【9】是否应该暂停？理想与现实 Emily Chang 问：一些人主张暂停，给监管时间赶上，给社会时间适应。在一个完美的世界里，如果所有公司和国家都暂停，Hassabis 会支持吗？ “我想是的。”他说。他提到这一直是他的梦想。“当我 15 年前创立 DeepMind、25 年前开始从事 AI 工作时，我的路线图是：当我们接近 AGI 这个门槛时刻时，我们可能会以科学的方式合作。” 他描述了一个“AI 版 CERN”的愿景：世界上最优秀的人才聚集在一起，以非常严谨的科学方式完成最后的步骤。“不只是技术专家，还包括哲学家、社会科学家、经济学家，共同思考我们想从这项技术中得到什么，如何以造福全人类的方式利用它。” 【编者注】CERN（欧洲核子研究中心）是全球最大的粒子物理学实验室，由 23 个成员国共同运营，是国际科学合作的典范。但他话锋一转：“不幸的是，这需要国际合作。即使一家公司、一个国家，甚至整个西方决定这样做，除非全世界至少在一些最低标准上达成一致，否则没有用。而现在国际合作有点棘手。” Emily Chang 追问：如果 AGI 在 2030 年到来，而监管还没有到位，我们是否注定会遇到困难？ Hassabis 说他仍然乐观，希望足够多的领先参与者能够沟通并合作，至少在安全和安保协议上。“我们已经与 Anthropic 等公司在这些方面进行了相当密切的合作。” 当被问到是否愿意与 Sam Altman 合作时，Hassabis 说：“可能吧。我和几乎所有领先实验室的领导者关系都相当好。如果风险足够高——我认为每个人在未来 2 到 3 年会更清楚地认识到风险和代价。” --- 【10】Transformer 是死胡同吗？Hassabis 不同意 Emily Chang 提到 Yann LeCun 说他不认为 Transformer 和 LLM 单独能让我们达到 AGI。【编者注】Yann LeCun 是图灵奖得主、Meta 前首席 AI 科学家。他在 2025 年 11 月离开 Meta，创立了一家专注于“世界模型”的新公司。他多次公开称 LLM 是通向人类级智能的“死胡同”，认为它们缺乏对物理世界的理解、缺乏常识和因果关系。 Hassabis 明确表示不同意：“我不同意它们是死胡同，我认为那显然是错的——它们已经如此有用了。” 但他也承认这是一个经验性问题。“我认为有 50% 的概率，仅仅扩展现有方法加上一些调整就足够了。可能足够。” 他认为无论如何都值得这样做，因为即使需要其他东西，“这些 LLM 也将是最终 AGI 系统的一个极其重要的组件。唯一的问题是：它是唯一的组件吗？” 他估计可能还需要一到五个突破，“可能是世界模型——这是 Yann 谈到的，我们也在研究这个，事实上我们拥有目前最好的世界模型 Genie，我直接参与了那个项目，我认为它非常重要。” 【编者注】Genie 是 DeepMind 开发的“世界模型”系列。2025 年 8 月发布的 Genie 3 可以根据文本提示生成可交互的 3D 环境，被 DeepMind 视为通向 AGI 的重要阶梯，并被 TIME 杂志评为 2025 年最佳发明之一。他还提到了持续学习、系统一致性、更好的推理和长期规划等仍然缺失的能力。“从 Google DeepMind 的角度来看，我们在两个方向上都在全力推进——既发明新事物，也扩展现有事物。” --- 【11】“我们从未离开研究时代” Emily Chang 提到 Ilya Sutskever 说“通过扩展和做更大模型来获得改进的时代几乎结束了”。【编者注】Ilya Sutskever 是 OpenAI 联合创始人，于 2024 年离开后创立了 Safe Superintelligence Inc. (SSI)。2025 年 11 月在 Dwarkesh Patel 的播客中，他表示 2012-2020 年是“研究时代”，2020-2025 年是“扩展时代”，现在“又回到了研究时代”。 Hassabis 的回应很有意思：“不，我不同意。他的原话是‘我们又回到了研究时代’。我爱 Ilya，我们是很好的朋友，在很多事情上看法一致，但我的观点是——我们从未离开研究时代。” 他强调 DeepMind 一直在投资研究，拥有“最深厚、最广泛的研究储备”。“如果你看过去十年，Google 和 DeepMind 加在一起发明了大约 90% 的突破性技术——当然最著名的是 Transformer，还有深度强化学习、AlphaGo 等。如果未来需要新的突破，我会押注我们，就像过去一样，会是做出那些突破的人。” --- 【12】奇点来了吗？“太早了” Emily Chang 最后一个“同意还是不同意”的问题：Elon Musk 说我们已经进入了奇点。【编者注】2025 年底至 2026 年初，Elon Musk 在 X 平台上多次发帖称“我们已经进入了奇点”和“2026 年是奇点之年”，引发广泛讨论。他回应的是 Midjourney 创始人 David Holz 关于 AI 工具让他在圣诞假期完成了比过去十年更多编程项目的帖子。 “不，我不同意。我认为那非常过早。”Hassabis 说，“奇点是完全 AGI 到来的另一种说法，我之前解释了为什么我认为我们离那还很远。” 他承认即使 5 年也不算长，但“我认为在我们拥有任何看起来像奇点的东西之前，还有很多工作要做。” --- 【13】Google 的文化与创始人的参与 Emily Chang 问到 Google 内部现在的文化，以及 Larry Page 和 Sergey Brin 的参与程度。 Hassabis 说两位创始人都非常投入。“Larry 更多在战略层面，你会在董事会议上见到他。Sergey 更亲力亲为，参与 Gemini 团队的编码，更多涉及算法细节。” 他说这是一个“对计算机科学来说绝对不可思议的时刻”，科学上、人类历史上都是如此。“当然每个人都想亲身参与其中。” 他描述了自己试图结合多种优势：创业公司快速发布和冒险的能量，大公司的资源，以及长期和探索性研究的空间。“我认为过去一年进展顺利，我们还能做得更好，今年会做得更好。我认为我们的进步轨迹是业内最陡峭的。” --- 【14】为什么应该信任 Google？ Emily Chang 说所有这些公司都在要求我们信任他们，特别是如果监管跟不上技术的话。她直接问：为什么我们应该信任你们？为什么 Google 是最值得信任的地方？ Hassabis 说需要通过行动来判断这些公司，也要看领导者的动机。 “我选择 Google 作为 DeepMind 的归宿有几个原因。主要原因是 Google 的创始人和他们建立 Google 的方式——作为一家科学公司。很多人忘了 Google 本身是 Larry 和 Sergey 的 PhD 项目。所以我对他们感到一种直接的亲近感。” 他还提到了 Google 董事会的构成。“主席 John Hennessy 是图灵奖得主，Frances Arnold 是另一位诺贝尔奖得主。这些在企业董事会中是非常罕见的人物。” 【编者注】John Hennessy 是斯坦福大学前校长，因 RISC 架构获得 2017 年图灵奖。Frances Arnold 因定向进化研究获得 2018 年诺贝尔化学奖。他说这种科学和研究主导的文化意味着“在最高水平做科学意味着真正严谨、深思熟虑，并在任何可能的地方应用科学方法。不只是对技术，也是对你作为一个组织的运营方式。” 最后他提到 Google 的使命。“‘组织世界的信息’——我认为这是一个非常崇高的目标。它与 DeepMind 的使命‘解决智能，然后用它解决一切其他问题’非常契合。这两个使命天然配合——AI 和组织世界的信息天然相关。” --- 【15】后稀缺世界：比经济更担心的是“意义” Emily Chang 问：后稀缺世界，人们不再有工作。Hassabis 在实现所有技术目标后打算做什么？ “我想用它来探索物理学的极限。这是我在学校时最喜欢的科目——那些大问题。现实的本质是什么？意识的本质是什么？费米悖论的答案？时间是什么？引力是什么？” 他说了一句令人印象深刻的话：“我惊讶于更多人不去思考这些巨大的问题。我们只是日复一日地生活，而这些深刻的谜题几乎在向我尖叫——答案是什么？” 他希望用 AI 探索所有这些问题，“也许还有星际旅行，借助新能源和 AI 解锁的材料。” Emily Chang 问：如果我们没有工作，我们还会有意义和目的吗？ Hassabis 回答道：“老实说，这是我比经济问题更担心的事情。我认为经济几乎是一个政治问题——当我们获得所有这些额外的收益和生产力时，我们能否确保它为每个人的利益而分享？我相信这是可以做到的。” “但比这更大的问题是：我们很多人从工作和科学事业中获得的目的和意义，在新世界中我们将如何找到？” 他说我们需要“一些新的伟大哲学家”来帮助思考这个问题。“也许我们会在艺术和探索上变得更加精致，还有极限运动之类的。今天我们做很多不只是为了经济利益的事情，也许未来我们会有这些事情的非常高深的版本。” --- 【16】给年轻人和企业家的建议 Emily Chang 最后问：房间里的每个人都在想他们应该做什么。10 年后，人们关于 AI 最大的错误会是什么？ Hassabis 给出了两条建议。第一条是给年轻一代的：“我们唯一确定的是会有大量的变化。所以在学习技能方面，要准备好‘学会学习’——这是最重要的事情。你能多快适应新情况，用我们拥有的工具吸收新信息。” 第二条是给商业领袖的：“现在有很多领先模型和服务提供商，还会有更多。选择那些你认为正在以正确方式行事的合作伙伴。与那些正在推动变革、以你希望看到的方式对待这项技术的人合作。” 他总结说：“我认为我们可以一起构建那个未来——随着 AI 的到来，一个我们都想要的未来。” --- 【写在最后】这场访谈中，Hassabis 展现了一种独特的气质：既是最前沿竞争的参与者，又试图保持长线思考的清醒。他与几位同行的分歧值得注意：比 Dario Amodei 更保守地估计就业冲击，比 Elon Musk 更审慎地看待奇点，比 Ilya Sutskever 更相信 scaling 仍有价值，比 Yann LeCun 更认可 Transformer 的未来。但他们有一个共识：无论 AGI 是 2030 年还是更早到来，我们可能都没有准备好。Hassabis 想要的“AI 版 CERN”需要国际合作，而他自己也承认“现在国际合作有点棘手”。最后一个细节让我印象深刻。当被问到后稀缺世界的愿景时，这位每周工作 100 小时的 CEO 说他最想做的事情是思考“时间是什么？引力是什么？”——那些“几乎在向我尖叫”的宇宙深层谜题。也许这就是为什么他能在“科技史上最激烈的竞争”中保持某种平静：对他来说，AGI 不是终点，而是探索更大问题的起点。

YouTube

中文

14

69

206

53.4K

xingxb retweetledi

动察Beating@BeatingOfficial·21 Oca

x.com/i/article/2013…

ZXX

8

15

76

21.5K

xingxb@AnneXingxb·19 Oca

最近总是段永平，纳瓦尔，Dan koe 。时间也从1 day 到1 hour 了。就好像成功的故事真能复制一样。努力不一定成功，不努力一定轻松。我先躺会儿。 #鸡汤 #焦虑 #content #anxious

中文

0

59

xingxb@AnneXingxb·19 Oca

每一次交互都是其“即时测试计算”，推动能力进化。 3、终极图景：成为理解“偏好”的认知伙伴演化的高级阶段是成为理解用户情境与个人偏好（taste）的认知共生伙伴，解决不确定性问题，其“自我”在互动关系中涌现。

中文

0

27

xingxb@AnneXingxb·19 Oca

1、演化核心：从“存储”到“经验” LLM智能体的未来不在于记住更多数据（Storage），而在于能将交互内化为可迁移的经验与知识（Experience），实现持续学习与成长。 2、实现路径：通过“主动探索”与“交互内化” 关键突破是智能体需具备主动探索能力，在对话中主动发现、整理并抽象知识，而非被动响应。

中文

1

0

28

xingxb@AnneXingxb·19 Oca

chat——CEO 我觉得这个比喻很形象 chat——CTO code——CTO cowork——COO LLM智能体的进化正从“外部存储”迈向“内部经验”。未来关键不在更聪明，而在通过主动探索内化交互，成为理解我们偏好的认知伙伴。交互即演化。 #Anthropic #claude #coworker #coding

𝙩𝙮≃𝙛{𝕩}^A𝕀²·ℙarad𝕚g𝕞@TaNGSoFT

x.com/i/article/2013…

中文

1

0

1

366

xingxb@AnneXingxb·14 Oca

@yan5xu 以思维代存，用记忆换空间——这不是压缩观察，而是让思考本身成为压缩算法。

中文

0

105

yan5xu@yan5xu·13 Oca

刚深扒了一下 MiroThinker 1.5，他们这套 Agent 压缩方式有点邪门，但看懂了觉得确实有用。核心解决的是「怎么在 256K 上下文里塞进去 400 次 Tool Use」的问题。他们做了一个极其大胆的操作：对ReAct历史上 think-action-observation 中的的 Observation（工具返回结果）进行物理掩码。除了最近 K 轮保留原文，之前的几百轮 Tool Result 全部替换成一句 "Tool result is omitted to save tokens"。但是完整保留了所有的。这里面有一个非常反直觉的地方，这个 agent 本身就是在做 deep research，那他只留最近 K 轮，也就是 5 轮的原文，前面都没有了，还怎么能回答问题。这就有一个非常隐晦但关键的前提：只要 Thought 足够密，它其实就是在无限逼近 Summary。每一次 Thought 的生成，本质上都是模型对当前 Observation 的一次信息切片。T1 产生时已经把 O1 里的关键数据“吃”进脑子了。虽然 O1 被替换成了占位符，但 T1 还在。T1 就成了 O1 的“信息压缩包”。不需要额外挂一个 Summary Agent，这条完整的 Thought 链，本身就是一份不断增量更新的、高保真的「动态摘要」。