min_wu
651 posts


翻到这张1992年的老照片,确实被震撼到了。那时候的马斯克才21岁,青涩得不行,正和宾大的室友任宇翔勾肩搭背。谁能想到,这一拍,竟然埋下了后来特斯拉上海超级工厂的种子?
这可不是什么普通的同窗合影。任宇翔当年是物理奥赛金牌得主,连马斯克都亲口承认物理功底不如他。两人在宾大泡图书馆,后来又结伴去了斯坦福。这哪是普通同学,简直是“神仙组合”。
2015年,马斯克一个电话,任宇翔直接出任特斯拉亚太区副总裁。那个“当年拿地、当年开工、当年投产”的上海奇迹,背后站着的就是这位老友。
有时候想想,所谓的顶级圈层,可能真就是年轻时那点纯粹的交情。当你还在绞尽脑汁搞人脉时,人家早就靠着当年的“战友情”,把事业做成了全球顶流。
中文

@howlemont 我昨天用gpt5.5做研究的时候,也发现一个很小但很神奇的交叉点。问题和解法都存在了10年,只是在两个不同的领域。而且chatgpt都快4年了,还是没人发现。解法那么自然直接,我都不知道值不值得写个论文。
中文

OpenAI突然就突破了一个数学问题,
很多研发人员表示心情无法言喻,晚上都失眠了
想象一下:你拿一堆钉子(n个点),钉在一张大纸上。你想让尽量多的钉子对儿之间,正好隔着1厘米(不能多不能少,就1厘米)。
这个问题是1946年由数学家保罗·埃尔德什(Erdős)提出来的,叫“平面单位距离问题”。问的其实就是最多能有多少对儿钉子正好1厘米远?
80年来,大家都以为最好的排列方法就是方格子,像国际象棋棋盘,或者像学校的操场画的正方形网格。
把方格稍微缩放一下,就能得到差不多 n(一点点慢慢长大的额外因子) × 1厘米对儿。
埃尔德什本人甚至猜想最多也就 n^{1+o(1)}这么多(就是 n 乘以上一个“趋近于1的额外小数”,永远超不过 n 的某个固定次方)。 结果呢?OpenAI的一个普通推理模型(还不是专门为数学设计的超级AI,就是一个通用思考机),自己琢磨了半天,它的思考过程有足足125页PDF,突然发现:不对!我们可以用一种更牛的办法!它发明了全新的一整族点排列方式(无限多个例子),让1厘米对儿的数量一下子跳到 n^{1+δ},其中 δ ≈ 0.014(普林斯顿数学家Will Sawin后来帮它算精确了)。这可是多项式级别的真正提升,像从“慢慢爬”直接变成“火箭加速”。 它怎么做到的?用了一种超级深的代数数论技巧(叫“无限类域塔”和Golod–Shafarevich理论)。
简单比喻就是以前大家只用“高斯整数”(a+bi那种复数)来造方格;AI却造了更复杂的数塔,像一层一层叠起来的魔法数字城堡,让点和点之间“啪啪啪”撞出远超以前的1厘米对儿。完全出乎人类80年的预期,把埃尔德什那个“方格子差不多最优”的信念直接打翻了。
为什么所有研究者都震惊到睡不着?
1. 这是80年的老大难问题,被AI一次性干掉了而且是自主解决的!不是人喂它提示、专门训练它数学,而是它自己想出来的原创构造。数学史上第一次,AI独立解决了一个真正核心的开放研究问题(不是IMO竞赛题,是那种顶刊级别的猜想)。
2. 它把两个八竿子打不着的领域连起来了:离散几何(钉子怎么摆)和代数数论(抽象的数字城堡)。人类数学家都没往这个方向深挖,它却一头扎进去,还成了。
Fields奖得主Tim Gowers看完直接表示:“如果这是一个人写的论文,我会毫不犹豫推荐到《Annals of Mathematics》(数学界顶级期刊)发表。”
3. 发出了超强音的宣告:AI现在不只是“帮人类算算题”或“查文献”,它能自己发现新路、提出新想法、给出完整证明。
Gowers、Noga Alon、Arul Shankar等一堆大牛都亲自验证,还写了个“人类版解释论文”说:这玩意儿靠谱,而且漂亮得惊人。
4. 对未来的冲击:人类仿佛看到了地平线的一抹晨光,AI马上就能帮人类在生物、物理、医学、工程上加速突破了。人类还是掌舵人,但AI成了超级得力的“发现伙伴”。这是要范式转变了。
所以数学家、AI研究者们今晚都刷着论文、讨论链路、激动得睡不着。就像1970年代突然发现黑洞、或者突然证明费马大定理那天一样,历史性时刻来了。
总结:这些AI不是“抄作业”,它是自己发明了一种全新的“钉子摆法”,把80年没人敢动的猜想推翻了。
研究者们见证到了数学和科学发现方式的革命,难怪大家集体失眠。
你,看懂了吗?
不懂就去找OpenAI去要原证明和125页思考过程吗吧,他们都公开了。
反正我是没懂!
OpenAI@OpenAI
Today, we share a breakthrough on the planar unit distance problem, a famous open question first posed by Paul Erdős in 1946. For nearly 80 years, mathematicians believed the best possible solutions looked roughly like square grids. An OpenAI model has now disproved that belief, discovering an entirely new family of constructions that performs better. This marks the first time AI has autonomously solved a prominent open problem central to a field of mathematics.
中文

Codex这么可怕的东西
竟然只有几百万人高频使用,几十亿人置身事外
想想觉得非常荒诞
Clara J@Clara_J_0529
Claude code这么可怕的东西 竟然只有几百万人高频使用,几十亿人置身事外 想想觉得非常荒诞
中文

我们公司的财务也沉迷 codex 编程了,天天在那里 vibcoding 自己的财务管理系统。
我现在每天打开来,都有变化。“不务正业”😄🫠

水哥@szuljq
今天光gpt-5.5就花了一千刀,工资都不够token 谁能体会无限token的快乐@tuzi_ai
中文

@lansea @0xLogicrw @zhang_benita 瞎猜: 那个自下而上的团队可能构建了一套极其高效的自动化环境(Sandbox),让模型生成的代码在编译器或解释器中运行,并将运行结果(报错信息、单元测试结果、输出对错)作为强化学习(RL)的信号。
中文

前 Anthropic 研究科学家、现 Google DeepMind 研究科学家姚顺宇,在 @zhang_benita 播客「语言即世界」中首次披露了 Claude 3.7 的内部研发过程。他在 2024 年 10 月加入 Anthropic 后被分进一个名为 Horizon 的团队,当时整个团队只有 10 到 11 个人,却负责 Anthropic 强化学习的全部工作,包括数据、基础设施和算法研究。Claude 3.7 从启动研究到最终发布总共耗时四五个月,前两三个月做算法和数据研究,后两个月做训练和基础设施搭建。
Anthropic 押注代码能力并非一开始就有规划。姚顺宇透露,Claude 3 之所以写代码比 GPT-4 强,背后有一个他无法公开的纯技术原因,是某个团队自下而上做出来的。Claude 3 发布后 Twitter 上的大量正面反馈验证了这一优势,Anthropic 管理层随即把代码能力升级为公司级战略全力押注。他认为 Anthropic 能这样快速下重注,核心在于技术一号位 Jared Kaplan 和 Sam McCandlish 本身就是联合创始人,技术上服众的同时也有权拍板,而 OpenAI 做不到这点,Ilya 在的时候也许行,但后来失去了决策权就走了。当时的 Anthropic 在产品方面几乎没有意识,Claude 3.5 半年内发了两个版本却用同一个名字,最终靠外界起的绰号「3.6」才勉强区分开来。
中文















