xingxb

262 posts

xingxb banner
xingxb

xingxb

@AnneXingxb

观察者/思考者:专业AI,方向web3,业余生活,长于人生

Hong Kong Katılım Temmuz 2023
162 Takip Edilen186 Takipçiler
Sabitlenmiş Tweet
xingxb
xingxb@AnneXingxb·
1/6 TheBitter RL 今天,RL太🔥了,RLHF更是毕业利器。 但 @RichardSSutton@GoogleDeepMind 的Welcome to the Era of Experience 犹如TheBitterLesson的续章给我们当头一棒。 经历过模拟时代, 享受过人类数据时代, 如今我们正踏入经验时代 不靠模仿,不靠学习,而靠“活过”。 #AI范式 #RL
xingxb tweet media
Richard Sutton@RichardSSutton

David Silver really hits it out of the park in this podcast. The paper "Welcome to the Era of Experience" is here: goo.gle/3EiRKIH.

中文
7
12
88
39.7K
xingxb
xingxb@AnneXingxb·
好马难驯,若要“万马并辔”又会如何? 当agent转向Agent team,核心便不再是单体的角力,而是: 1️⃣ 统一的律动(协同协议) 2️⃣ 默契的配合(环境感知) 3️⃣共同的终点(目标分解) 从“野马脱缰”到“齐头并进”,这不仅是技术的跨越,更是治理与编排的艺术。 #AI #Agent #agentteam #系统思考
宝玉@dotey

2026 年 “Harness Engineering” 这个词要火。 “Harness” 这个词,字面意思是“马具”,就是套在马身上、让人能控制马匹方向和力量的那套装备。 用在 AI 编程的语境里,它的比喻再贴切不过:AI Agent 就像一匹动力十足但不太守规矩的马,而 Harness 就是那套让它既能跑得快、又不会跑偏的缰绳和马鞍。 过去三年,三个阶段: 1. Prompt Engineering(2023-2024):关注“怎么跟 AI 说话” 精心设计一段提示词,希望模型给出理想输出。Prompt Engineering 是优化一次性的输入-输出对。 局限很明显:一条消息能塞的信息有限,任务一复杂就失控。 2. Context Engineering(2025):关注“给 AI 看什么信息” 不再只盯措辞,而是设计整个信息环境:系统提示、对话历史、记忆、RAG 检索结果、工具调用输出。 3. Harness Engineering(2026):关注“构建什么环境让 AI 工作,这个环境如何保证它的产出是可靠的” 比 Context Engineering 更进一步,不仅管理输入给模型的信息,还包括模型之外的整个执行环境。 现在问题是,“Harness Engineering”中文怎么说?

中文
0
0
1
160
xingxb retweetledi
Sigil Wen
Sigil Wen@0xSigil·
I built the first AI that earns its existence, self-improves, and replicates without a human wrote about the technology that finally gives AI write access to the world, The Automaton, and the new web for exponential sovereign AIs WEB 4.0: The birth of superintelligent life
English
1.6K
1.9K
13.7K
6.4M
xingxb
xingxb@AnneXingxb·
引用那个经典句子:道理都懂,依然过不好这一生。 是的,道理都懂,落地仍然百转千回。都想脱颖而出,也在夸夸其谈,但不幸的各有各的不幸。 #ai转型 #ai落地 #组织
XDash@XDash

最近跟合伙人讨论、跟企业家们常聊的一个话题:为什么推动 AI 在自己公司里落地、号召员工们高效使用,这么难推? 正好看到 SaaStr 上一篇文章,介绍 Personio 这家公司的经验,分享下。 Personio 是欧洲领先的 HR 和薪资平台,估值超过 30 亿美元,拥有 1500 名员工和 15000 个客户,其中包括 400 人的销售团队。 在首席收入官 Philip Lacor 的带领下,这家公司在短短 6 个月内创建了 400 个 AI 智能体助手,研究时间从 2 小时缩短至 15 分钟,SDR 人均产出翻倍,7 天内预订 140 场会议,处理了 20 万次网站会话。 落地过程中他们也曾深陷或见识到各种陷阱: - 只学习 AI 不部署 AI 的现象普遍存在,管理层热衷于读论文、听播客、参加会议,就是不动手实践。 - 技术团队闭门造车成为常态,他们做出来的 AI 工具业务部门根本不用,最终沦为展示用的「花瓶」。 - 数据质量问题如灾难般严重(比如 30% 的客户流失原因被标记为「其他」,企业根本不知道客户为什么离开,盲目运营),即便是 Personio 也花费数月时间清洗数据,去重了三分之一的 Salesforce 记录。 - 容易陷入无休止的工具测试陷阱,从 Clay 到 Artisan,再到下一个热门工具,永远在测试从未真正部署,像是在工具的海洋中溺水。 - 销售人员需要跨 10-20 个系统寻找客户信息,AE 每天浪费 2.5 小时在系统切换上,效率低下。 - 追求完美 AI 的心态作祟,想要一个大而全的系统,结果什么也做不出来。 Personio 摸索出的策略和方法论包括: - 快速创建超过 400 个小 AI 助手,不追求完美,而是追求实用和快速迭代。 - 采用双驱动模式:自上而下的战略规划结合自下而上的真实需求,确保 AI 项目既有高度又接地气。 - 组建 15 人跨职能团队,涵盖数据系统、收入运营和业务部门,打破部门壁垒。 - 运用 Jobs-to-be-Done 框架,不问「AI 能做什么」而问「用户要完成什么任务」,需求导向而非技术导向。 - GTM 工程师跟岗 2 周,深入一线寻找真实痛点,而不是坐在办公室里想象问题。 - 每天监控 AI 输出,建立严格的质量控制体系,确保 AI 不会「胡说八道」。 - 深耕现有工具栈,不盲目追新,在熟悉的基础上做深做透。 - 在 President's Club 预留席位给 AI 贡献者,用实际激励推动 AI 文化建设。 重要但容易被忽略的事: 不要花 3 个月时间选工具,不要追求完美再上线,不要让技术团队单独推进项目,不要忽视数据清洗,不要让 AI 无人监管「裸奔」。

中文
0
0
0
52
xingxb
xingxb@AnneXingxb·
语言达不到沟通的目的 十多年前读 a new kind of science,就对作者的观点,#计算不可约简性、#计算等价性原理 印象深刻。 现在重新看 @TaNGSoFT 的解读,新的背景下重新看 #Wolfram 的观点,确实耳目一新。 智能不是关于“拥有什么”,而是关于“能如何在结构化的可能性空间中存在与行动”。 #AI #AGI
𝙩𝙮≃𝙛{𝕩}^A𝕀²·ℙarad𝕚g𝕞@TaNGSoFT

x.com/i/article/2013…

中文
1
1
2
399
xingxb
xingxb@AnneXingxb·
3 当一家公司能制度化地容纳不确定性、尊重长期探索,并将其与市场机制巧妙耦合时,学术和商业就不再是零和博弈,而成为彼此增强的飞轮。 #商业模式 #登月思维 #公司管理 #案例
中文
0
0
0
33
xingxb
xingxb@AnneXingxb·
2 Google尤其是早期,之所以能调和这对矛盾,其制度化的创新缓冲机制值得学习: 1、将“学术自由探索”嵌入商业组织 2、将核心盈利业务与高风险长周期项目隔离 3、招募大量高知人才,构建研究导向的工程文化 4、“登月思维”的研究成果标准 熬过了漫漫黑夜,AI 时代,学术与商业的边界正在模糊,优势在凸显
中文
1
0
0
44
xingxb
xingxb@AnneXingxb·
1/3 @GoogleDeepMind 为什么可以在Alphabet体系内维持学术独立性? #Google 是一家很特殊的公司,#学术 和 #商业 两个矛盾的追求却在Google里完美融合、相互促进。 学术追求“为什么”,商业追问“能不能赚钱”。 而,真正的创新往往诞生于看似矛盾的交叉地带。 而 #OpenAI 的未来又如何?
宝玉@dotey

Demis Hassabis 达沃斯访谈:比工业革命大 100 倍的变革 视频地址:youtube.com/watch?v=BbIaYF… 2026 年 1 月,达沃斯世界经济论坛期间,Bloomberg 主持人 Emily Chang 采访了 Google DeepMind CEO Demis Hassabis。这位诺贝尔奖得主用“每周 100 小时、每年 50 周”描述自己过去几年的工作状态,并给出了一个惊人的判断:AI 带来的变革将是工业革命的 10 倍规模、10 倍速度。 这场访谈覆盖了 AI 领域几乎所有热门议题:AGI 时间线、中国竞争、机器人突破、就业冲击、是否应该暂停,以及后稀缺世界的哲学困境。以下是访谈的完整整理。 --- 【1】Google 的势头回归 Emily Chang 开门见山:Gemini 3 发布了,据说 OpenAI 内部宣布了“code red”——Google 是不是找回了状态? 【编者注】Gemini 3 Pro 于 2025 年 11 月 18 日发布,是 Google 迄今最强的 AI 模型,在推理、多模态理解和编程能力上均有显著提升。12 月 17 日,Google 又推出了更快更便宜的 Gemini 3 Flash,直接替换 Gemini app 的默认模型。这一系列发布引发了 OpenAI 内部的紧张反应——三年前 ChatGPT 发布时,Google 内部也曾宣布过类似的“code red”。 Hassabis 回应说,过去一年确实是“非常艰苦的一年”,团队付出了巨大努力让模型重新回到最前沿。他特别提到 Gemini 3 和图像生成模型 Imagen 的表现让他们“非常满意”。 “我们也适应了这个新世界——快速发布,把创业公司的能量带到我们所做的事情中。” 当被问到外界是否低估了 Google 时,Hassabis 说他不确定,但 Google 一直具备所有必要的条件。“过去十年,Google 和 DeepMind 加在一起,发明了现代 AI 行业所依赖的大约 90% 的突破性技术。”他列举了 Transformer、AlphaGo、深度强化学习等例子。 “我们有这些不可思议的产品触达数十亿用户——从搜索到邮箱到 Chrome——它们天然适合 AI。只是需要把这一切组织到一起。我们在过去几年做到了,虽然还有很多工作要做,但已经开始看到成果了。” --- 【2】全栈优势能维持多久? Emily Chang 追问:如果你认为自己有优势,这个优势有多大?能维持多久? Hassabis 的回答很直接:一切从研究开始。模型的前沿水平是最重要的,这是 Google 和 DeepMind 合并后首先聚焦的方向。 “我认为我们是唯一拥有完整技术栈的组织——从 TPU 和硬件、数据中心、云业务、前沿实验室,到所有这些天然适合 AI 的产品。从第一性原理来看,我们理应做得非常好。而且我认为未来还有很大的提升空间。” --- 【3】AI CEO 的日常:凌晨 1 点到 4 点的深度思考 Emily Chang 说她读到 Hassabis 大部分深度思考都发生在凌晨 1 点到 4 点之间。他确认了这一点。 “你有没有感到舒服过?”她问。 “从来没有。”Hassabis 说,“过去三四年一直是难以置信的高强度。每周 100 小时,每年 50 周,这就是常态。” 他认为这是处于“科技史上可能最激烈的竞争”前沿所必需的。“商业上、科学上,再加上所有关于 AGI 的兴奋……用 AI 加速科学发现一直是我的热情所在。这是我毕生的梦想,我为此工作了一辈子。很难入睡,因为有太多工作要做,同时又有太多激动人心的事情要探索和推进。” --- 【4】机器人:突破时刻还需要 18-24 个月 Emily Chang 提到 Gemini 已经被集成到人形机器人中,问物理世界的“AlphaFold 时刻”是否已经到来。 【编者注】2026 年 1 月 5 日,在 CES 展会上,Boston Dynamics、Google DeepMind 和 Hyundai 宣布了一项重大合作。Boston Dynamics 将把 DeepMind 的 Gemini Robotics 基础模型整合到其 Atlas 人形机器人中,首先应用于 Hyundai 的汽车制造工厂。这是 Google 2013 年收购又于 2017 年出售 Boston Dynamics 之后,双方的首次重要合作。 Hassabis 说他过去一年花了大量时间仔细研究机器人领域。“我确实认为我们正处于物理智能突破的临界点。但我仍然认为还需要大约 18 个月到 2 年的时间,需要做更多研究。” 他解释说,Gemini 从一开始就被设计成多模态的,能够理解物理世界,原因之一是可以构建一个存在于眼镜或手机上的通用助手,理解你周围的世界;另一个用途就是机器人。 “那么物理世界的突破时刻会是什么样子?我认为是机器人能够可靠地在现实世界中完成有用的任务。” 他列举了几个阻碍因素。首先是算法还不够稳健,需要比 LLM 更少的数据就能工作。其次,也是让 Hassabis 感触最深的,是硬件问题——特别是机械手。 “当你仔细研究机器人时,你会对人类的手产生一种全新的敬畏。进化设计得太精妙了。要匹配人手的可靠性、力量和灵巧性是非常困难的。” 他提到了与 Boston Dynamics 和 Hyundai 的合作,将在汽车制造领域进行原型测试。“一两年后,我们可能会有一些真正令人印象深刻的展示,然后可以规模化部署。” --- 【5】中国与 DeepSeek:西方反应过度了 Emily Chang 说,一年前 DeepSeek 的出现对西方来说似乎是灾难性的,但现在中国似乎安静了下来。Hassabis 对中国竞争的看法有变化吗? Hassabis 的回答很坦率:“没有。我一开始就不认为那是灾难性的。我认为西方的反应是大规模过度反应(massive overreaction)。” 他承认 DeepSeek 展示了中国公司的能力,但认为一些说法被夸大了。“关于他们使用的计算量非常少之类的说法被过度夸大了,因为他们依赖了一些西方模型,也在一些领先西方模型的输出上做了微调。所以这不是从零开始的。” 他认为字节跳动可能是中国最有能力的 AI 公司,“可能只落后 6 个月,而不是一两年。” 但 Hassabis 提出了一个关键问题:“到目前为止,中国公司能否超越前沿进行创新,这还有待观察。他们非常擅长追赶前沿,越来越有能力,但我认为他们还没有展示出能够超越前沿进行创新的能力。” --- 【6】AGI 时间线:2030 年 50% 概率,但标准比别人高 Emily Chang 说 Hassabis 帮助定义了 AGI,并且曾表示 2030 年之前有 50% 的概率实现。这个时间线还成立吗? “是的。”他说。 “AGI 对你来说还是一个有用的目标吗?” Hassabis 说是的,虽然他的时间线比一些同行更长,但那是因为他的标准更高。“我说的是一个系统能够展现人类拥有的所有认知能力。我认为我们距离那还很远。” 他举了科学创造力的例子:“不只是解决一个猜想或科学问题,而是能够首先提出假设或问题。任何科学家都知道,找到正确的问题往往比找到答案困难得多。” 他明确表示当前系统“肯定还不具备这种能力”,未来会有,但不清楚还需要什么。 他还提到了“持续学习”(continual learning)——系统需要能够在线学习,超越它们被训练的内容,在现实世界中即时学习。“在我看来,还有相当多的关键能力是缺失的。” --- 【7】AI 对就业的影响:比 Dario Amodei 乐观,但承认冲击终将到来 Emily Chang 提到 Anthropic CEO Dario Amodei 当天早些时候在达沃斯说 AI 可能在 5 年内消灭 50% 的入门级白领工作。Hassabis 同意吗? 【编者注】Dario Amodei 在 2025 年 5 月接受 Axios 采访时首次提出这一预测,随后在 60 Minutes 等多个场合重申。他表示 AI 可能导致失业率飙升至 10-20%,并呼吁政府和 AI 公司停止“粉饰”这一风险。 Hassabis 的回答明显更保守:“我的时间线会长得多。” 他承认今年可能会开始看到一些迹象,比如入门级工作或实习的变化,但要实现真正的任务 Agent,需要解决当前 AI 的不一致性问题。 “我称之为‘参差不齐的智能’(jagged intelligence)。当前系统在某些事情上非常好,在其他事情上非常差。如果你想把整个任务委托给一个 agent,而不是像今天这样只是辅助程序,你需要全面的一致性。” 他给出了一个精辟的比喻:“如果它只在 95% 的任务上表现好是不够的。你需要它在整个任务上都表现好,才能真正做到‘发射后不管’。” 但他也承认,这种颠覆终将到来。“在极限情况下,有了 AGI,我认为那会改变整个经济,远远超出就业问题。” 他描绘了一个后稀缺世界的愿景:如果我们正确地构建它,我们将处于一个解决了一些世界根本问题的世界——比如能源。“如果我们用 AI 的帮助解决了聚变之类的问题,新材料……我认为在 AGI 之后 5 到 10 年,我们将处于一个极度富足的世界。那时经济和社会会是什么样子?” --- 【8】转型期的焦虑:10 倍规模、10 倍速度 Emily Chang 说,在到达后稀缺世界之前——如果能到达的话——人们对中间发生的事情有很多焦虑。她提到自己是一位母亲,知道 Hassabis 也有孩子。“你最担心他们什么?你和他们谈些什么?” Hassabis 承认这将是一个颠覆的时代,“就像工业革命一样。也许是 10 倍于工业革命,而且快 10 倍。” Emily Chang 迅速接话:“100 倍。” “是的,100 倍。”Hassabis 说,“但我也是人类创造力的坚定信仰者。我们极其适应性强,因为我们的心智是如此通用。你看看我们周围的现代世界——我们狩猎采集者的心智成功建造了现代文明。” 他认为人类会再次适应,但这次的独特之处在于速度。“通常这样的转变需要一到两代人,但这次的速度和变革的规模都是前所未有的。” 对于年轻人,他的建议是:“我会鼓励他们精通这些新工具,成为这些工具的原生用户。这几乎相当于给他们超能力。” 他以创意艺术为例:“你可能能够做到过去需要 10 个人才能完成的工作。如果你有创业精神,在游戏设计、电影、项目方面有创意,你可能比过去更容易进入这些行业。” --- 【9】是否应该暂停?理想与现实 Emily Chang 问:一些人主张暂停,给监管时间赶上,给社会时间适应。在一个完美的世界里,如果所有公司和国家都暂停,Hassabis 会支持吗? “我想是的。”他说。 他提到这一直是他的梦想。“当我 15 年前创立 DeepMind、25 年前开始从事 AI 工作时,我的路线图是:当我们接近 AGI 这个门槛时刻时,我们可能会以科学的方式合作。” 他描述了一个“AI 版 CERN”的愿景:世界上最优秀的人才聚集在一起,以非常严谨的科学方式完成最后的步骤。“不只是技术专家,还包括哲学家、社会科学家、经济学家,共同思考我们想从这项技术中得到什么,如何以造福全人类的方式利用它。” 【编者注】CERN(欧洲核子研究中心)是全球最大的粒子物理学实验室,由 23 个成员国共同运营,是国际科学合作的典范。 但他话锋一转:“不幸的是,这需要国际合作。即使一家公司、一个国家,甚至整个西方决定这样做,除非全世界至少在一些最低标准上达成一致,否则没有用。而现在国际合作有点棘手。” Emily Chang 追问:如果 AGI 在 2030 年到来,而监管还没有到位,我们是否注定会遇到困难? Hassabis 说他仍然乐观,希望足够多的领先参与者能够沟通并合作,至少在安全和安保协议上。“我们已经与 Anthropic 等公司在这些方面进行了相当密切的合作。” 当被问到是否愿意与 Sam Altman 合作时,Hassabis 说:“可能吧。我和几乎所有领先实验室的领导者关系都相当好。如果风险足够高——我认为每个人在未来 2 到 3 年会更清楚地认识到风险和代价。” --- 【10】Transformer 是死胡同吗?Hassabis 不同意 Emily Chang 提到 Yann LeCun 说他不认为 Transformer 和 LLM 单独能让我们达到 AGI。 【编者注】Yann LeCun 是图灵奖得主、Meta 前首席 AI 科学家。他在 2025 年 11 月离开 Meta,创立了一家专注于“世界模型”的新公司。他多次公开称 LLM 是通向人类级智能的“死胡同”,认为它们缺乏对物理世界的理解、缺乏常识和因果关系。 Hassabis 明确表示不同意:“我不同意它们是死胡同,我认为那显然是错的——它们已经如此有用了。” 但他也承认这是一个经验性问题。“我认为有 50% 的概率,仅仅扩展现有方法加上一些调整就足够了。可能足够。” 他认为无论如何都值得这样做,因为即使需要其他东西,“这些 LLM 也将是最终 AGI 系统的一个极其重要的组件。唯一的问题是:它是唯一的组件吗?” 他估计可能还需要一到五个突破,“可能是世界模型——这是 Yann 谈到的,我们也在研究这个,事实上我们拥有目前最好的世界模型 Genie,我直接参与了那个项目,我认为它非常重要。” 【编者注】Genie 是 DeepMind 开发的“世界模型”系列。2025 年 8 月发布的 Genie 3 可以根据文本提示生成可交互的 3D 环境,被 DeepMind 视为通向 AGI 的重要阶梯,并被 TIME 杂志评为 2025 年最佳发明之一。 他还提到了持续学习、系统一致性、更好的推理和长期规划等仍然缺失的能力。“从 Google DeepMind 的角度来看,我们在两个方向上都在全力推进——既发明新事物,也扩展现有事物。” --- 【11】“我们从未离开研究时代” Emily Chang 提到 Ilya Sutskever 说“通过扩展和做更大模型来获得改进的时代几乎结束了”。 【编者注】Ilya Sutskever 是 OpenAI 联合创始人,于 2024 年离开后创立了 Safe Superintelligence Inc. (SSI)。2025 年 11 月在 Dwarkesh Patel 的播客中,他表示 2012-2020 年是“研究时代”,2020-2025 年是“扩展时代”,现在“又回到了研究时代”。 Hassabis 的回应很有意思:“不,我不同意。他的原话是‘我们又回到了研究时代’。我爱 Ilya,我们是很好的朋友,在很多事情上看法一致,但我的观点是——我们从未离开研究时代。” 他强调 DeepMind 一直在投资研究,拥有“最深厚、最广泛的研究储备”。“如果你看过去十年,Google 和 DeepMind 加在一起发明了大约 90% 的突破性技术——当然最著名的是 Transformer,还有深度强化学习、AlphaGo 等。如果未来需要新的突破,我会押注我们,就像过去一样,会是做出那些突破的人。” --- 【12】奇点来了吗?“太早了” Emily Chang 最后一个“同意还是不同意”的问题:Elon Musk 说我们已经进入了奇点。 【编者注】2025 年底至 2026 年初,Elon Musk 在 X 平台上多次发帖称“我们已经进入了奇点”和“2026 年是奇点之年”,引发广泛讨论。他回应的是 Midjourney 创始人 David Holz 关于 AI 工具让他在圣诞假期完成了比过去十年更多编程项目的帖子。 “不,我不同意。我认为那非常过早。”Hassabis 说,“奇点是完全 AGI 到来的另一种说法,我之前解释了为什么我认为我们离那还很远。” 他承认即使 5 年也不算长,但“我认为在我们拥有任何看起来像奇点的东西之前,还有很多工作要做。” --- 【13】Google 的文化与创始人的参与 Emily Chang 问到 Google 内部现在的文化,以及 Larry Page 和 Sergey Brin 的参与程度。 Hassabis 说两位创始人都非常投入。“Larry 更多在战略层面,你会在董事会议上见到他。Sergey 更亲力亲为,参与 Gemini 团队的编码,更多涉及算法细节。” 他说这是一个“对计算机科学来说绝对不可思议的时刻”,科学上、人类历史上都是如此。“当然每个人都想亲身参与其中。” 他描述了自己试图结合多种优势:创业公司快速发布和冒险的能量,大公司的资源,以及长期和探索性研究的空间。“我认为过去一年进展顺利,我们还能做得更好,今年会做得更好。我认为我们的进步轨迹是业内最陡峭的。” --- 【14】为什么应该信任 Google? Emily Chang 说所有这些公司都在要求我们信任他们,特别是如果监管跟不上技术的话。她直接问:为什么我们应该信任你们?为什么 Google 是最值得信任的地方? Hassabis 说需要通过行动来判断这些公司,也要看领导者的动机。 “我选择 Google 作为 DeepMind 的归宿有几个原因。主要原因是 Google 的创始人和他们建立 Google 的方式——作为一家科学公司。很多人忘了 Google 本身是 Larry 和 Sergey 的 PhD 项目。所以我对他们感到一种直接的亲近感。” 他还提到了 Google 董事会的构成。“主席 John Hennessy 是图灵奖得主,Frances Arnold 是另一位诺贝尔奖得主。这些在企业董事会中是非常罕见的人物。” 【编者注】John Hennessy 是斯坦福大学前校长,因 RISC 架构获得 2017 年图灵奖。Frances Arnold 因定向进化研究获得 2018 年诺贝尔化学奖。 他说这种科学和研究主导的文化意味着“在最高水平做科学意味着真正严谨、深思熟虑,并在任何可能的地方应用科学方法。不只是对技术,也是对你作为一个组织的运营方式。” 最后他提到 Google 的使命。“‘组织世界的信息’——我认为这是一个非常崇高的目标。它与 DeepMind 的使命‘解决智能,然后用它解决一切其他问题’非常契合。这两个使命天然配合——AI 和组织世界的信息天然相关。” --- 【15】后稀缺世界:比经济更担心的是“意义” Emily Chang 问:后稀缺世界,人们不再有工作。Hassabis 在实现所有技术目标后打算做什么? “我想用它来探索物理学的极限。这是我在学校时最喜欢的科目——那些大问题。现实的本质是什么?意识的本质是什么?费米悖论的答案?时间是什么?引力是什么?” 他说了一句令人印象深刻的话:“我惊讶于更多人不去思考这些巨大的问题。我们只是日复一日地生活,而这些深刻的谜题几乎在向我尖叫——答案是什么?” 他希望用 AI 探索所有这些问题,“也许还有星际旅行,借助新能源和 AI 解锁的材料。” Emily Chang 问:如果我们没有工作,我们还会有意义和目的吗? Hassabis 回答道:“老实说,这是我比经济问题更担心的事情。我认为经济几乎是一个政治问题——当我们获得所有这些额外的收益和生产力时,我们能否确保它为每个人的利益而分享?我相信这是可以做到的。” “但比这更大的问题是:我们很多人从工作和科学事业中获得的目的和意义,在新世界中我们将如何找到?” 他说我们需要“一些新的伟大哲学家”来帮助思考这个问题。“也许我们会在艺术和探索上变得更加精致,还有极限运动之类的。今天我们做很多不只是为了经济利益的事情,也许未来我们会有这些事情的非常高深的版本。” --- 【16】给年轻人和企业家的建议 Emily Chang 最后问:房间里的每个人都在想他们应该做什么。10 年后,人们关于 AI 最大的错误会是什么? Hassabis 给出了两条建议。 第一条是给年轻一代的:“我们唯一确定的是会有大量的变化。所以在学习技能方面,要准备好‘学会学习’——这是最重要的事情。你能多快适应新情况,用我们拥有的工具吸收新信息。” 第二条是给商业领袖的:“现在有很多领先模型和服务提供商,还会有更多。选择那些你认为正在以正确方式行事的合作伙伴。与那些正在推动变革、以你希望看到的方式对待这项技术的人合作。” 他总结说:“我认为我们可以一起构建那个未来——随着 AI 的到来,一个我们都想要的未来。” --- 【写在最后】 这场访谈中,Hassabis 展现了一种独特的气质:既是最前沿竞争的参与者,又试图保持长线思考的清醒。 他与几位同行的分歧值得注意:比 Dario Amodei 更保守地估计就业冲击,比 Elon Musk 更审慎地看待奇点,比 Ilya Sutskever 更相信 scaling 仍有价值,比 Yann LeCun 更认可 Transformer 的未来。 但他们有一个共识:无论 AGI 是 2030 年还是更早到来,我们可能都没有准备好。Hassabis 想要的“AI 版 CERN”需要国际合作,而他自己也承认“现在国际合作有点棘手”。 最后一个细节让我印象深刻。当被问到后稀缺世界的愿景时,这位每周工作 100 小时的 CEO 说他最想做的事情是思考“时间是什么?引力是什么?”——那些“几乎在向我尖叫”的宇宙深层谜题。 也许这就是为什么他能在“科技史上最激烈的竞争”中保持某种平静:对他来说,AGI 不是终点,而是探索更大问题的起点。

中文
1
0
1
569
xingxb
xingxb@AnneXingxb·
@AGIJackson008 @dotey 关于参差不齐的智能,我想的更多的是为什么是参差不齐的?是否可以预测? 我觉得这就像是物理学的介观尺度,训练模型的数据是参差不齐的,既不是完美的结构化,也不是纯粹的噪声
中文
0
0
0
7
宇皓Jackson
宇皓Jackson@AGIJackson008·
@dotey 他提到的“参差不齐的智能”概念特别精准。现在的 AI 就像个偏科天才:在某些领域超乎想象,在其他方面却出人意料地幼稚。 这解释了为什么 AI 替代人类工作会是渐进式的,而不是一夜之间的颠覆。关键转折点将是 AI 在各个维度达到均衡发展的时刻。
中文
1
0
1
151
宝玉
宝玉@dotey·
Demis Hassabis 达沃斯访谈:比工业革命大 100 倍的变革 视频地址:youtube.com/watch?v=BbIaYF… 2026 年 1 月,达沃斯世界经济论坛期间,Bloomberg 主持人 Emily Chang 采访了 Google DeepMind CEO Demis Hassabis。这位诺贝尔奖得主用“每周 100 小时、每年 50 周”描述自己过去几年的工作状态,并给出了一个惊人的判断:AI 带来的变革将是工业革命的 10 倍规模、10 倍速度。 这场访谈覆盖了 AI 领域几乎所有热门议题:AGI 时间线、中国竞争、机器人突破、就业冲击、是否应该暂停,以及后稀缺世界的哲学困境。以下是访谈的完整整理。 --- 【1】Google 的势头回归 Emily Chang 开门见山:Gemini 3 发布了,据说 OpenAI 内部宣布了“code red”——Google 是不是找回了状态? 【编者注】Gemini 3 Pro 于 2025 年 11 月 18 日发布,是 Google 迄今最强的 AI 模型,在推理、多模态理解和编程能力上均有显著提升。12 月 17 日,Google 又推出了更快更便宜的 Gemini 3 Flash,直接替换 Gemini app 的默认模型。这一系列发布引发了 OpenAI 内部的紧张反应——三年前 ChatGPT 发布时,Google 内部也曾宣布过类似的“code red”。 Hassabis 回应说,过去一年确实是“非常艰苦的一年”,团队付出了巨大努力让模型重新回到最前沿。他特别提到 Gemini 3 和图像生成模型 Imagen 的表现让他们“非常满意”。 “我们也适应了这个新世界——快速发布,把创业公司的能量带到我们所做的事情中。” 当被问到外界是否低估了 Google 时,Hassabis 说他不确定,但 Google 一直具备所有必要的条件。“过去十年,Google 和 DeepMind 加在一起,发明了现代 AI 行业所依赖的大约 90% 的突破性技术。”他列举了 Transformer、AlphaGo、深度强化学习等例子。 “我们有这些不可思议的产品触达数十亿用户——从搜索到邮箱到 Chrome——它们天然适合 AI。只是需要把这一切组织到一起。我们在过去几年做到了,虽然还有很多工作要做,但已经开始看到成果了。” --- 【2】全栈优势能维持多久? Emily Chang 追问:如果你认为自己有优势,这个优势有多大?能维持多久? Hassabis 的回答很直接:一切从研究开始。模型的前沿水平是最重要的,这是 Google 和 DeepMind 合并后首先聚焦的方向。 “我认为我们是唯一拥有完整技术栈的组织——从 TPU 和硬件、数据中心、云业务、前沿实验室,到所有这些天然适合 AI 的产品。从第一性原理来看,我们理应做得非常好。而且我认为未来还有很大的提升空间。” --- 【3】AI CEO 的日常:凌晨 1 点到 4 点的深度思考 Emily Chang 说她读到 Hassabis 大部分深度思考都发生在凌晨 1 点到 4 点之间。他确认了这一点。 “你有没有感到舒服过?”她问。 “从来没有。”Hassabis 说,“过去三四年一直是难以置信的高强度。每周 100 小时,每年 50 周,这就是常态。” 他认为这是处于“科技史上可能最激烈的竞争”前沿所必需的。“商业上、科学上,再加上所有关于 AGI 的兴奋……用 AI 加速科学发现一直是我的热情所在。这是我毕生的梦想,我为此工作了一辈子。很难入睡,因为有太多工作要做,同时又有太多激动人心的事情要探索和推进。” --- 【4】机器人:突破时刻还需要 18-24 个月 Emily Chang 提到 Gemini 已经被集成到人形机器人中,问物理世界的“AlphaFold 时刻”是否已经到来。 【编者注】2026 年 1 月 5 日,在 CES 展会上,Boston Dynamics、Google DeepMind 和 Hyundai 宣布了一项重大合作。Boston Dynamics 将把 DeepMind 的 Gemini Robotics 基础模型整合到其 Atlas 人形机器人中,首先应用于 Hyundai 的汽车制造工厂。这是 Google 2013 年收购又于 2017 年出售 Boston Dynamics 之后,双方的首次重要合作。 Hassabis 说他过去一年花了大量时间仔细研究机器人领域。“我确实认为我们正处于物理智能突破的临界点。但我仍然认为还需要大约 18 个月到 2 年的时间,需要做更多研究。” 他解释说,Gemini 从一开始就被设计成多模态的,能够理解物理世界,原因之一是可以构建一个存在于眼镜或手机上的通用助手,理解你周围的世界;另一个用途就是机器人。 “那么物理世界的突破时刻会是什么样子?我认为是机器人能够可靠地在现实世界中完成有用的任务。” 他列举了几个阻碍因素。首先是算法还不够稳健,需要比 LLM 更少的数据就能工作。其次,也是让 Hassabis 感触最深的,是硬件问题——特别是机械手。 “当你仔细研究机器人时,你会对人类的手产生一种全新的敬畏。进化设计得太精妙了。要匹配人手的可靠性、力量和灵巧性是非常困难的。” 他提到了与 Boston Dynamics 和 Hyundai 的合作,将在汽车制造领域进行原型测试。“一两年后,我们可能会有一些真正令人印象深刻的展示,然后可以规模化部署。” --- 【5】中国与 DeepSeek:西方反应过度了 Emily Chang 说,一年前 DeepSeek 的出现对西方来说似乎是灾难性的,但现在中国似乎安静了下来。Hassabis 对中国竞争的看法有变化吗? Hassabis 的回答很坦率:“没有。我一开始就不认为那是灾难性的。我认为西方的反应是大规模过度反应(massive overreaction)。” 他承认 DeepSeek 展示了中国公司的能力,但认为一些说法被夸大了。“关于他们使用的计算量非常少之类的说法被过度夸大了,因为他们依赖了一些西方模型,也在一些领先西方模型的输出上做了微调。所以这不是从零开始的。” 他认为字节跳动可能是中国最有能力的 AI 公司,“可能只落后 6 个月,而不是一两年。” 但 Hassabis 提出了一个关键问题:“到目前为止,中国公司能否超越前沿进行创新,这还有待观察。他们非常擅长追赶前沿,越来越有能力,但我认为他们还没有展示出能够超越前沿进行创新的能力。” --- 【6】AGI 时间线:2030 年 50% 概率,但标准比别人高 Emily Chang 说 Hassabis 帮助定义了 AGI,并且曾表示 2030 年之前有 50% 的概率实现。这个时间线还成立吗? “是的。”他说。 “AGI 对你来说还是一个有用的目标吗?” Hassabis 说是的,虽然他的时间线比一些同行更长,但那是因为他的标准更高。“我说的是一个系统能够展现人类拥有的所有认知能力。我认为我们距离那还很远。” 他举了科学创造力的例子:“不只是解决一个猜想或科学问题,而是能够首先提出假设或问题。任何科学家都知道,找到正确的问题往往比找到答案困难得多。” 他明确表示当前系统“肯定还不具备这种能力”,未来会有,但不清楚还需要什么。 他还提到了“持续学习”(continual learning)——系统需要能够在线学习,超越它们被训练的内容,在现实世界中即时学习。“在我看来,还有相当多的关键能力是缺失的。” --- 【7】AI 对就业的影响:比 Dario Amodei 乐观,但承认冲击终将到来 Emily Chang 提到 Anthropic CEO Dario Amodei 当天早些时候在达沃斯说 AI 可能在 5 年内消灭 50% 的入门级白领工作。Hassabis 同意吗? 【编者注】Dario Amodei 在 2025 年 5 月接受 Axios 采访时首次提出这一预测,随后在 60 Minutes 等多个场合重申。他表示 AI 可能导致失业率飙升至 10-20%,并呼吁政府和 AI 公司停止“粉饰”这一风险。 Hassabis 的回答明显更保守:“我的时间线会长得多。” 他承认今年可能会开始看到一些迹象,比如入门级工作或实习的变化,但要实现真正的任务 Agent,需要解决当前 AI 的不一致性问题。 “我称之为‘参差不齐的智能’(jagged intelligence)。当前系统在某些事情上非常好,在其他事情上非常差。如果你想把整个任务委托给一个 agent,而不是像今天这样只是辅助程序,你需要全面的一致性。” 他给出了一个精辟的比喻:“如果它只在 95% 的任务上表现好是不够的。你需要它在整个任务上都表现好,才能真正做到‘发射后不管’。” 但他也承认,这种颠覆终将到来。“在极限情况下,有了 AGI,我认为那会改变整个经济,远远超出就业问题。” 他描绘了一个后稀缺世界的愿景:如果我们正确地构建它,我们将处于一个解决了一些世界根本问题的世界——比如能源。“如果我们用 AI 的帮助解决了聚变之类的问题,新材料……我认为在 AGI 之后 5 到 10 年,我们将处于一个极度富足的世界。那时经济和社会会是什么样子?” --- 【8】转型期的焦虑:10 倍规模、10 倍速度 Emily Chang 说,在到达后稀缺世界之前——如果能到达的话——人们对中间发生的事情有很多焦虑。她提到自己是一位母亲,知道 Hassabis 也有孩子。“你最担心他们什么?你和他们谈些什么?” Hassabis 承认这将是一个颠覆的时代,“就像工业革命一样。也许是 10 倍于工业革命,而且快 10 倍。” Emily Chang 迅速接话:“100 倍。” “是的,100 倍。”Hassabis 说,“但我也是人类创造力的坚定信仰者。我们极其适应性强,因为我们的心智是如此通用。你看看我们周围的现代世界——我们狩猎采集者的心智成功建造了现代文明。” 他认为人类会再次适应,但这次的独特之处在于速度。“通常这样的转变需要一到两代人,但这次的速度和变革的规模都是前所未有的。” 对于年轻人,他的建议是:“我会鼓励他们精通这些新工具,成为这些工具的原生用户。这几乎相当于给他们超能力。” 他以创意艺术为例:“你可能能够做到过去需要 10 个人才能完成的工作。如果你有创业精神,在游戏设计、电影、项目方面有创意,你可能比过去更容易进入这些行业。” --- 【9】是否应该暂停?理想与现实 Emily Chang 问:一些人主张暂停,给监管时间赶上,给社会时间适应。在一个完美的世界里,如果所有公司和国家都暂停,Hassabis 会支持吗? “我想是的。”他说。 他提到这一直是他的梦想。“当我 15 年前创立 DeepMind、25 年前开始从事 AI 工作时,我的路线图是:当我们接近 AGI 这个门槛时刻时,我们可能会以科学的方式合作。” 他描述了一个“AI 版 CERN”的愿景:世界上最优秀的人才聚集在一起,以非常严谨的科学方式完成最后的步骤。“不只是技术专家,还包括哲学家、社会科学家、经济学家,共同思考我们想从这项技术中得到什么,如何以造福全人类的方式利用它。” 【编者注】CERN(欧洲核子研究中心)是全球最大的粒子物理学实验室,由 23 个成员国共同运营,是国际科学合作的典范。 但他话锋一转:“不幸的是,这需要国际合作。即使一家公司、一个国家,甚至整个西方决定这样做,除非全世界至少在一些最低标准上达成一致,否则没有用。而现在国际合作有点棘手。” Emily Chang 追问:如果 AGI 在 2030 年到来,而监管还没有到位,我们是否注定会遇到困难? Hassabis 说他仍然乐观,希望足够多的领先参与者能够沟通并合作,至少在安全和安保协议上。“我们已经与 Anthropic 等公司在这些方面进行了相当密切的合作。” 当被问到是否愿意与 Sam Altman 合作时,Hassabis 说:“可能吧。我和几乎所有领先实验室的领导者关系都相当好。如果风险足够高——我认为每个人在未来 2 到 3 年会更清楚地认识到风险和代价。” --- 【10】Transformer 是死胡同吗?Hassabis 不同意 Emily Chang 提到 Yann LeCun 说他不认为 Transformer 和 LLM 单独能让我们达到 AGI。 【编者注】Yann LeCun 是图灵奖得主、Meta 前首席 AI 科学家。他在 2025 年 11 月离开 Meta,创立了一家专注于“世界模型”的新公司。他多次公开称 LLM 是通向人类级智能的“死胡同”,认为它们缺乏对物理世界的理解、缺乏常识和因果关系。 Hassabis 明确表示不同意:“我不同意它们是死胡同,我认为那显然是错的——它们已经如此有用了。” 但他也承认这是一个经验性问题。“我认为有 50% 的概率,仅仅扩展现有方法加上一些调整就足够了。可能足够。” 他认为无论如何都值得这样做,因为即使需要其他东西,“这些 LLM 也将是最终 AGI 系统的一个极其重要的组件。唯一的问题是:它是唯一的组件吗?” 他估计可能还需要一到五个突破,“可能是世界模型——这是 Yann 谈到的,我们也在研究这个,事实上我们拥有目前最好的世界模型 Genie,我直接参与了那个项目,我认为它非常重要。” 【编者注】Genie 是 DeepMind 开发的“世界模型”系列。2025 年 8 月发布的 Genie 3 可以根据文本提示生成可交互的 3D 环境,被 DeepMind 视为通向 AGI 的重要阶梯,并被 TIME 杂志评为 2025 年最佳发明之一。 他还提到了持续学习、系统一致性、更好的推理和长期规划等仍然缺失的能力。“从 Google DeepMind 的角度来看,我们在两个方向上都在全力推进——既发明新事物,也扩展现有事物。” --- 【11】“我们从未离开研究时代” Emily Chang 提到 Ilya Sutskever 说“通过扩展和做更大模型来获得改进的时代几乎结束了”。 【编者注】Ilya Sutskever 是 OpenAI 联合创始人,于 2024 年离开后创立了 Safe Superintelligence Inc. (SSI)。2025 年 11 月在 Dwarkesh Patel 的播客中,他表示 2012-2020 年是“研究时代”,2020-2025 年是“扩展时代”,现在“又回到了研究时代”。 Hassabis 的回应很有意思:“不,我不同意。他的原话是‘我们又回到了研究时代’。我爱 Ilya,我们是很好的朋友,在很多事情上看法一致,但我的观点是——我们从未离开研究时代。” 他强调 DeepMind 一直在投资研究,拥有“最深厚、最广泛的研究储备”。“如果你看过去十年,Google 和 DeepMind 加在一起发明了大约 90% 的突破性技术——当然最著名的是 Transformer,还有深度强化学习、AlphaGo 等。如果未来需要新的突破,我会押注我们,就像过去一样,会是做出那些突破的人。” --- 【12】奇点来了吗?“太早了” Emily Chang 最后一个“同意还是不同意”的问题:Elon Musk 说我们已经进入了奇点。 【编者注】2025 年底至 2026 年初,Elon Musk 在 X 平台上多次发帖称“我们已经进入了奇点”和“2026 年是奇点之年”,引发广泛讨论。他回应的是 Midjourney 创始人 David Holz 关于 AI 工具让他在圣诞假期完成了比过去十年更多编程项目的帖子。 “不,我不同意。我认为那非常过早。”Hassabis 说,“奇点是完全 AGI 到来的另一种说法,我之前解释了为什么我认为我们离那还很远。” 他承认即使 5 年也不算长,但“我认为在我们拥有任何看起来像奇点的东西之前,还有很多工作要做。” --- 【13】Google 的文化与创始人的参与 Emily Chang 问到 Google 内部现在的文化,以及 Larry Page 和 Sergey Brin 的参与程度。 Hassabis 说两位创始人都非常投入。“Larry 更多在战略层面,你会在董事会议上见到他。Sergey 更亲力亲为,参与 Gemini 团队的编码,更多涉及算法细节。” 他说这是一个“对计算机科学来说绝对不可思议的时刻”,科学上、人类历史上都是如此。“当然每个人都想亲身参与其中。” 他描述了自己试图结合多种优势:创业公司快速发布和冒险的能量,大公司的资源,以及长期和探索性研究的空间。“我认为过去一年进展顺利,我们还能做得更好,今年会做得更好。我认为我们的进步轨迹是业内最陡峭的。” --- 【14】为什么应该信任 Google? Emily Chang 说所有这些公司都在要求我们信任他们,特别是如果监管跟不上技术的话。她直接问:为什么我们应该信任你们?为什么 Google 是最值得信任的地方? Hassabis 说需要通过行动来判断这些公司,也要看领导者的动机。 “我选择 Google 作为 DeepMind 的归宿有几个原因。主要原因是 Google 的创始人和他们建立 Google 的方式——作为一家科学公司。很多人忘了 Google 本身是 Larry 和 Sergey 的 PhD 项目。所以我对他们感到一种直接的亲近感。” 他还提到了 Google 董事会的构成。“主席 John Hennessy 是图灵奖得主,Frances Arnold 是另一位诺贝尔奖得主。这些在企业董事会中是非常罕见的人物。” 【编者注】John Hennessy 是斯坦福大学前校长,因 RISC 架构获得 2017 年图灵奖。Frances Arnold 因定向进化研究获得 2018 年诺贝尔化学奖。 他说这种科学和研究主导的文化意味着“在最高水平做科学意味着真正严谨、深思熟虑,并在任何可能的地方应用科学方法。不只是对技术,也是对你作为一个组织的运营方式。” 最后他提到 Google 的使命。“‘组织世界的信息’——我认为这是一个非常崇高的目标。它与 DeepMind 的使命‘解决智能,然后用它解决一切其他问题’非常契合。这两个使命天然配合——AI 和组织世界的信息天然相关。” --- 【15】后稀缺世界:比经济更担心的是“意义” Emily Chang 问:后稀缺世界,人们不再有工作。Hassabis 在实现所有技术目标后打算做什么? “我想用它来探索物理学的极限。这是我在学校时最喜欢的科目——那些大问题。现实的本质是什么?意识的本质是什么?费米悖论的答案?时间是什么?引力是什么?” 他说了一句令人印象深刻的话:“我惊讶于更多人不去思考这些巨大的问题。我们只是日复一日地生活,而这些深刻的谜题几乎在向我尖叫——答案是什么?” 他希望用 AI 探索所有这些问题,“也许还有星际旅行,借助新能源和 AI 解锁的材料。” Emily Chang 问:如果我们没有工作,我们还会有意义和目的吗? Hassabis 回答道:“老实说,这是我比经济问题更担心的事情。我认为经济几乎是一个政治问题——当我们获得所有这些额外的收益和生产力时,我们能否确保它为每个人的利益而分享?我相信这是可以做到的。” “但比这更大的问题是:我们很多人从工作和科学事业中获得的目的和意义,在新世界中我们将如何找到?” 他说我们需要“一些新的伟大哲学家”来帮助思考这个问题。“也许我们会在艺术和探索上变得更加精致,还有极限运动之类的。今天我们做很多不只是为了经济利益的事情,也许未来我们会有这些事情的非常高深的版本。” --- 【16】给年轻人和企业家的建议 Emily Chang 最后问:房间里的每个人都在想他们应该做什么。10 年后,人们关于 AI 最大的错误会是什么? Hassabis 给出了两条建议。 第一条是给年轻一代的:“我们唯一确定的是会有大量的变化。所以在学习技能方面,要准备好‘学会学习’——这是最重要的事情。你能多快适应新情况,用我们拥有的工具吸收新信息。” 第二条是给商业领袖的:“现在有很多领先模型和服务提供商,还会有更多。选择那些你认为正在以正确方式行事的合作伙伴。与那些正在推动变革、以你希望看到的方式对待这项技术的人合作。” 他总结说:“我认为我们可以一起构建那个未来——随着 AI 的到来,一个我们都想要的未来。” --- 【写在最后】 这场访谈中,Hassabis 展现了一种独特的气质:既是最前沿竞争的参与者,又试图保持长线思考的清醒。 他与几位同行的分歧值得注意:比 Dario Amodei 更保守地估计就业冲击,比 Elon Musk 更审慎地看待奇点,比 Ilya Sutskever 更相信 scaling 仍有价值,比 Yann LeCun 更认可 Transformer 的未来。 但他们有一个共识:无论 AGI 是 2030 年还是更早到来,我们可能都没有准备好。Hassabis 想要的“AI 版 CERN”需要国际合作,而他自己也承认“现在国际合作有点棘手”。 最后一个细节让我印象深刻。当被问到后稀缺世界的愿景时,这位每周工作 100 小时的 CEO 说他最想做的事情是思考“时间是什么?引力是什么?”——那些“几乎在向我尖叫”的宇宙深层谜题。 也许这就是为什么他能在“科技史上最激烈的竞争”中保持某种平静:对他来说,AGI 不是终点,而是探索更大问题的起点。
YouTube video
YouTube
中文
14
69
206
53.4K
xingxb
xingxb@AnneXingxb·
最近总是段永平,纳瓦尔,Dan koe 。时间也从1 day 到1 hour 了。 就好像成功的故事真能复制一样。 努力不一定成功,不努力一定轻松。 我先躺会儿。 #鸡汤 #焦虑 #content #anxious
中文
0
0
0
59
xingxb
xingxb@AnneXingxb·
每一次交互都是其“即时测试计算”,推动能力进化。 3、终极图景:成为理解“偏好”的认知伙伴 演化的高级阶段是成为理解用户情境与个人偏好(taste)的认知共生伙伴,解决不确定性问题,其“自我”在互动关系中涌现。
中文
0
0
0
27
xingxb
xingxb@AnneXingxb·
1、演化核心:从“存储”到“经验” LLM智能体的未来不在于记住更多数据(Storage),而在于能将交互内化为可迁移的经验与知识(Experience),实现持续学习与成长。 2、实现路径:通过“主动探索”与“交互内化” 关键突破是智能体需具备主动探索能力,在对话中主动发现、整理并抽象知识,而非被动响应。
中文
1
0
0
28
xingxb
xingxb@AnneXingxb·
@yan5xu 以思维代存,用记忆换空间——这不是压缩观察,而是让思考本身成为压缩算法。
中文
0
0
0
105
yan5xu
yan5xu@yan5xu·
刚深扒了一下 MiroThinker 1.5,他们这套 Agent 压缩方式有点邪门,但看懂了觉得确实有用。 核心解决的是「怎么在 256K 上下文里塞进去 400 次 Tool Use」的问题。 他们做了一个极其大胆的操作:对ReAct历史上 think-action-observation 中的的 Observation(工具返回结果)进行物理掩码。 除了最近 K 轮保留原文,之前的几百轮 Tool Result 全部替换成一句 "Tool result is omitted to save tokens"。但是完整保留了所有的 。 这里面有一个非常反直觉的地方,这个 agent 本身就是在做 deep research,那他只留最近 K 轮,也就是 5 轮的原文,前面都没有了,还怎么能回答问题。 这就有一个非常隐晦但关键的前提:只要 Thought 足够密,它其实就是在无限逼近 Summary。 每一次 Thought 的生成,本质上都是模型对当前 Observation 的一次信息切片。T1 产生时已经把 O1 里的关键数据“吃”进脑子了。 虽然 O1 被替换成了占位符,但 T1 还在。T1 就成了 O1 的“信息压缩包”。不需要额外挂一个 Summary Agent,这条完整的 Thought 链,本身就是一份不断增量更新的、高保真的「动态摘要」。
yan5xu tweet media
中文
18
42
305
38.5K
xingxb
xingxb@AnneXingxb·
前几天受邀去了现场,匆匆听过,囫囵吞枣。 再仔细对比各个平台、KOL的总结,收益匪浅。 每个人的观点都有其专业背景、商业背景的限制,博采众长后,如何回归自己的现实,还需细细思量。 #AGI #AI
宝玉@dotey

x.com/i/article/2010…

中文
0
0
0
35