maosen
1.2K posts


Grok foundation model V9-Medium (1.5T) has finished training. Evals look good. A lot of Cursor data was added in supplementary training and there is more to come.
Fine-tuning is underway and reinforcement learning begins in a few days. 2 to 3 weeks to public release.
This will be a major improvement over the 0.5T v8-small that currently serves all Grok production traffic, especially for difficult coding tasks.
English

@uncleTakeaway AI模型通过对数学和编码能力的学习才让数字世界的agent能够出现,不然永远就是一个会聊天的文科生。AI模型通过对驾驶能力的学习才会让物理世界的agent能够出现,不然永远就是一个操作电脑的nerd。所以特斯拉才会去布局人形机器人和macrohard
中文

字节Seed 的Cola DLM 与MIT何恺明的ELF 几乎同时发布的研究,确实都在尝试打破离散 Token 的枷锁。
事实上,语言本身的离散性是客观存在的,这两篇论文的核心贡献,是把离散到连续的步骤推迟到了最后一刻。
结合我之前提到的苹果《The Illusion of Thinking》的讨论,这两篇论文的落地,提供了一些更底层的认知碰撞。
现有的自回归模型像是在进行爵士乐即兴口嗨。它每说出一个字,这个字就变成了不可更改的历史事实,它必须在这个事实的基础上下注、续写下一个字。这种机制导致它缺乏全局规划能力,一旦中间一步走错就会引发链式崩溃,这也是幻觉和推理复杂度墙的底层原因。
但是,Cola DLM 和 ELF 代表的连续扩散范式,更像是人类动笔前的脑部构思。它在连续的语义空间里,是在整体性地、模糊地揉搓和精炼一段语义。
对比之下,后者当然更能允许信息双向流动、允许自我修正,直到整段话的骨架和语义在空间里坍缩稳定了,才最终落笔变成具体的文字。这在理论上无疑为真正的全局规划提供了更优雅的数学载体。
我现在思考的问题是,如果文本生成自己主动降级或者说进化成连续的 Latent 向量空间建模,那么文本、图像、视频、音频在底层就实现了真正同质的连续信号对齐。
这样来看,我们可以设想的未来在于,大模型不需要再套厚重的 Tokenizer,多模态之间的转换,就像是在同一个连续水流里的不同涟漪,信息密度的交互会产生质的飞跃。
看完这两篇论文,我如是思考着。


中文

Tesla Robotaxi was at least ~1.81x safer than humans in April 2026. With the latest NHTSA crash report, and thanks to Robotaxi Tracker, I can finally report that Tesla Robotaxi in Austin surpassed average human safety in April 2026 (last month).
1. According to NHTSA, I estimate the human crash rate, including both reported and non-reported crashes, is ~249K miles per accident.
2. I collected all Tesla-reported mileage, as well as 7-day active fleet size from Robotaxi Tracker, and found the mileage is pretty predictable. This allows me to accurately estimate monthly Robotaxi mileage in Austin with <5% error.
3. Using the latest NHTSA crash report, I calculated the 3-month rolling crash rate, since Tesla sometimes has 0 monthly crashes. It clearly shows that in April, the 3-month rolling crash rate surpassed humans for the first time.

English

2026年了,没有什么观点是全新的。任何道理,古人说过,畅销书说过,自媒体博主都说过。
观点的稀缺性已经归零。
那什么还有稀缺性?
“你”
你和你的观点之间是什么关系?
你是怎么得出这个结论的?
你付出了什么代价才理解了这个道理?
你在什么情境下、带着什么伤疤、做了什么选择?
这才是不可替代的。这才是真正的"特定知识",这也是差异化。
同样一个道理,从书里读到的和从血里悟到的,穿透力差十倍。
那以上的观点我为何那么深刻呢?
因为,我影响了很多人看书,让我记得特别清楚的一次是有人给我转了 188 红包,告诉我,看了我的视频她也看书了,就因为这一点的改变,值得付费。
而这个视频讲的是,我从一个不看书的人变成了看书的人,我无意之中听到查理芒格所说:在任何领域我所见过的聪明人就没有一个不读书的。
所以我从查理芒格的经历产生的观点中,意识到读书的重要性了,我做出了改变,同时我的生活也被改变了,当我表达这个故事后,让很多人被我影响了,开始看书学习了。
中文

@Rustallintsla 这才到哪里啊:) tesla的未来 还有很多大波大浪的。believe it, hold it, enjoy it
中文

@DavidzhuLife 对于普通人来说,婚姻除了性,更重要的是互相扶持和相濡以沫,形成一个共同体来对抗风险和衰老。不要尝试去肢解这个人类形成了上万年的文明方式。
中文

花300万娶老婆 vs 花106万嫖30年,算完后我久久不能平静……
我粗略的算了一笔现实账:
正常年轻小夫妻,双方自愿的情况下,大概3天一次,一个月10次,一年120次。
从25岁结婚算起,未来30年大约就是3000次性生活、其中一大半还是越来越“交作业”式的,毫无体验感。
而这3000次,你需要付出的总成本大约是300万:
彩礼最低20万 + 五金5万
房子100万 + 车20万
逢年过节礼物、赡养女方父母
每月固定上交至少3000元(每年5万×30年=150万)、总计约300万。
如果你拿这300万去“自由配置”呢?
找小姐一次1000元,一个月10次就是1万,一年12万,30年才36万。
再买辆车20万 + 单身公寓50万;
全部加起来也才106万。
两者相差整整200万。
同样的3000次,婚姻版是越来越敷衍、越来越贵、还绑定一辈子。
小姐版是永远20岁出头、永远新鲜、永远可以挑、随时可以走。
更残酷的是:
婚姻里你花300万买的,是合法长期使用权 + 潜在反噬风险。而花106万买的,是纯粹的爽 + 绝对的自由。
这笔账一算,所谓的“彩礼婚姻”到底是在谈恋爱,还是在进行一场最昂贵、最不划算的长期包养呢?
中文

@myanTokenGeek 以前的软件开发模式才是手工作坊模式吧。现在的是真正的工业预制菜模式(大模型预训练好),然后在客户处加热撒葱花而已。反而是真正的软件工业
中文













