risent

13.4K posts

risent

@risent

👉 🖥️ Middle-aged coder | 🏓 Table tennis enthusiast

Shanghai Katılım Kasım 2008

1.4K Takip Edilen1.2K Takipçiler

risent@risent·5h

雷军京沪15小时抖音直播快结束的时候，陈年上来刷了两个大火箭

中文

risent@risent·11h

雷军今天这15小时连续京沪高速直播，连吃饭、喝水都要克制，吃清淡、哨喝水，应该是要防止中途少上厕所。

中文

105

risent@risent·13h

x.com/i/grok/share/f…

ZXX

risent@risent·16h

@paradisor092 哈哈，不过别说，看了一些张的直播教学，教学能力还是非常在线。类似的遥想当年乔丹当教练的能力就是非常拉。

中文

西泽尔福斯多二代目@paradisor092·1d

@risent 张继科要来出警了🐒 其实他只是不知道这个动作叫什么并且自信（

中文

risent@risent·1d

理论上来讲：乒乓球、网球、棒球、拳击的发力体系是相通，都是同一套动力学发力链条：蹬地 → 顶髋 → 转体 → 出手，“腰” 在整个过程中起到的是传导作用，而不是主动发力。中国乒乓球国家队在 2010 以前都是采用的错误的 “转腰” 发力，而欧洲选手从一开始就是合理的 “顶髋” 发力。

risent@risent

@StarKnight 腰的说法不太准确，应该是髋，髋发力，腰只是传导（来自于🏓爱好者的理解）

中文

307

risent retweetledi

fin@fi56622380·1d

今天芯片圈最大的新闻，莫过于Gerard在创立Nuvia CPU被高通收购五年之后，重新出发，新创立了ARM CPU公司，名字也跟之前非常像，叫Nuvacore 现在这个时间点做数据中心CPU，确实是赶上了CPU十年来最好的时代: AI agent带来CPU短缺潮已经经隐隐浮现，AWS多个客户都提出要包揽所有Graviton ARM CPU产能 ------------ 这个消息对硅谷的芯片打工人吸引力是巨大的，Nuvacore这次的阵容都是功成名就的明星阵容，以前Nuvia创始团队重新集合，拿了红衫的投资，做面向 AI 基础设施/agentic computing 的通用ARM CPU。当年还是一个尚未完全被验证的大方向都能大获成功，而现在ARM CPU服务器正在风口浪尖上，前景和想象力和2019年Nuvia比起来大了太多了上一次Gerard把Google，苹果platform architecture组的架构大佬挖了好多过去，这次的号召力只会强得多，240m的融资，已经验证过的路径和创始团队，肉眼可见的下一个增长风口，一定会让Nuvacore成为湾区最热门最受追捧的芯片startup，没有之一。毕竟这是一个肉眼可见能财富自由而且风险收益比极好的机会 ---------- 遥想当年Nuvia第一代CPU的发布赶上苹果M2时代，还是挺震撼的，Nuvia让高通在一年的时间CPU跑分进步了整整三代，单核跑分从2300变成3200，竟然超过了苹果M2 max一大截可惜Nuvia Phoenix core从发布到最后上市拖了太久太久，中间苹果把牙膏挤爆了连着上市了M3/M4，于是Nuvia CPU上市之后从跟M2比较变成了跟M4比较，从期待中的C位变成背景板了当年Nuvia的眼光非常超前，在2019年ARM CPU服务器市场占有率几乎为零的情况下，就是想从零开始打通这个市场，2021年被高通14亿美元收购之后，高通也给了无限的资源支持，扩招力度很大，给的薪水都是市面上最高一档的。可惜大环境在2022年恶化的很快，加上高通的管理层战略眼光实在太差太短视，在业界ARM服务器生态都开始有起色的时候，为了股价节约开支，竟然再一次把自家的Nuvia CPU 服务器团队解散了（算上2015年已经解散过一次ARM服务器团队）直到2025年，Nvidia的Grace ARM CPU都已经发布四年了，Vera ARM CPU都已经自研好久了，Amazon的ARM CPU Graviton都快占据CPU服务器新出货的50%了，高通才后知后觉谨慎的重启ARM服务器项目所以这次Gerard从高通的高管位置把之前的创始团队拉出来自己干，可能是因为高通高层战略眼光实在太差屡屡错过机会，上次Nuvia想做ARM服务器，高通的承诺也因为大环境恶化没做数，结果被收购之后被高通取消了项目直接改做了laptop芯片和手机芯片加上高通今年在手机销量上因为内存和存储历史级的巨额涨价，可以预见要受到重创(市场萎缩30%)，能拿出的扩张预算有限，在高通能拿到的资源是受到掣肘的而在创业公司里比在 Qualcomm 这种大平台里更容易拿到足够快的决策速度、团队纯度、产品定义权和资本叙事，于是选择在窗口已经被验证时重新集结老班底但更可能因为，AI时代的CPU前景想象力真的太广阔了，完全值得重新投入一次，不是Gerard变了，而是外部市场变了 ------------------------ 进入2025年之后，AI agent的出现，隐隐让CPU重新变成了瓶颈 CPU服务器重新步入增长轨道，而且潜力巨大，有好几个因素： 1. 随着推理时代的到来，GPU演化到针对推理的系统级新架构，CPU 是永远在忙的总指挥orchestrator, 因为要追求token throughput，所以异构计算阶段变多 + 批处理数量batch越来越大，scheduling/routing/data flow复杂度变高，对orchestration要求也变高所以在系统级异构推理架构里，AI加速器和GPU在CPU：GPU的配比上，也变得更为激进，从以前的1：4到Grace Blackwell的1：2，以后是很有希望达到1：1的比例的。Google TPU配Axion，Amazon Tranium配Graviton，Nvidia Rubin配自家Vera CPU 这条在我的去年11月半导体年终回顾写过，基本上在2026年成为了共识，虽然这部分主要是各家AI 芯片自研，并不是纯粹的CPU服务器，其实不算是外部CPU服务器的机会 2. 也是同一篇年终回顾里写到的：从CPU视角去看agentic workload，routing和工具处理都在CPU上，如果把常用的agentic框架做profiling，比如SWE-Agent, LangChain, Toolformer，CPU最长可以占到90%的E2E端到端延迟，throughput瓶颈也更多的卡在CPU，CPU甚至能耗也超过了总能耗的40% Agentic AI目前是一个CPU瓶颈更多的事情，Agent管理很多个CPU，再加上agent经常要开sandbox，很可能会成就CPU需求的新一波回暖现在回看去年写的这个逻辑，潜力是非常大的。但其实年初可能并没有很大规模发生，年初的CPU增长和各家渲染的CPU短缺潮和这个逻辑暂时关系不大，更多可能是前几年的capex投入GPU的比例太大，造成传统CPU服务器投入不够，所以需求上升是一个回补之前传统服务器投入不够的部分。但到了下半年甚至2027，agent会开始更广泛的铺开，比如智能导购和客服，已经占到了Amazon去年年底100万CPU采购的相当部分比例，这部分的增长是很快的前两个逻辑，基本上是今年主流叙事在讲CPU潜力的共识，但是我的感悟是，还有另外两个逻辑被低估了： 3. 造成CPU服务器潜力更大，更长线的主逻辑，可能和agent本身没有直接关系，而是code agent带来的副产物： coding门槛和速度的大幅优化，让“构建软件 + 连接软件 + 调用软件 + 自动化软件”这整件事便宜了一个数量级，Jevons 悖论在software供给端的展开，最终把世界推向更高的软件密度和 API 密度，这直接带来了CPU传统workload的线性上升从2025年年底开始，coding agent迎来了质变，Claude code迎来了爆发式增长，三个月的token营收增长了三倍，那么导致的下一步必然是Code量的十倍增长,以及App数量的巨量增长即便是在大厂，每天1m token消耗只能算是个平均水平，人均coding量必然是翻倍的（小厂就是翻十倍了），code供给量暴增，不会只停留在 repo 里，而会逐步变成更多长期运行的软件资产，长期存活的feature变多，product变多，microservice变多，API变多长线来看，App/API所有的生产成本和生产周期会变成原来的10%，API实现极大富足。那么API的Usage就会大量的上升,这就会造成传统CPU Workload或者说CPU Seconds大量的上升，这甚至和agentic没有直接关系时间维度上，这个逻辑并不是短期性质，Claude code的爆炸是这几个月刚发生的事情，那么产品上线，microservice，api上线，可能都要向后延迟。当软件变便宜，社会不会少用软件，只会把更多事情软件化所以也许到下半年甚至更久才会看到，传统cpu云的需求又莫名其妙增加了，表面上看，甚至和AI agent没有直接关系 4. CPU是一个技术上很难通缩的东西，不像内存/存储有很多压缩算法会降低单任务对存储的用量，CPU workload增长转化成硬件需求增长是实打实的比如说kvcache其实每年都有各种压缩技术出现，老的压缩技术比如kvcache的multi-head它会share一个head（GQV），这个大概会相当于4倍的压缩，再比如说去年turboquant这个技术也会新带来几倍的压缩。然后加上数据精度从FP16到现在的下一步要到FP4，精度的下降都会带来kvcache的压缩，从而带来存储方面的技术通缩。但CPU是一个技术层面上通缩量很小的事情，目前任何的agentic的cpu workload（CPU seconds）增长都是硬件需求增长，它通缩的方面只有每年每一代跑分提高的10%到15%。如果说另外通缩因素，比如云的五倍六倍的超卖会不会影响？不会，因为它一直是超卖的，所以说超卖/利用率低这个CPU技术通缩的因素不会继续扩大了，每个增长的CPU seconds都是不怎么带打折的硬件线性增长 ARM的指引是CPU的供需缺口可能会到30%以上，这几个原因的叠加，加上AI服务器对CPU服务器产能和订单的挤压，可能会让缺口更大，各个hyperscaler的反应可能是会滞后的 ------------------ CPU整体需求潜力增长的同时，ARM服务器CPU也赶上了历史上最好的时代： Hyperscaler为了节省成本，接近50%的新增传统server CPU都是ARM，Google的Axion，Amazon的Graviton，Microsoft的Cobolt，Graviton甚至2026年的产能已经全部卖完，瓶颈成了产能 Google TPU配Axion，Amazon Tranium配Graviton，Nvidia Rubin配自家Vera CPU，这部分CPU为什么会集体转向ARM，除了成本因素之外，也因为推理系统为了追求token throughput，batch越来越高越做越复杂，自研ARM CPU以及系统性软件硬件的co-design会更方便，比如Nvidia是Dynamo去控制Vera和Rubin之间的协同 Nuvacore的规划上来看，不仅仅满足于做IP，也要做成品，因为在招聘网站上出现了validation engineer的职位但是这次Nuvacore面临的挑战也不小：起步太晚了，无论是市场上，还是技术上，竞争都激烈了很多。CPU服务器和七年前比，已经复杂了很多，已经不再是单片CPU的竞争，而是rack系统级别的复杂度现在开始做2028~2029年上市的CPU，要做到rack级别有竞争力，规模要大很多，基本上要几十个chiplet，500+个core拼起来，还要考虑如何适配AI agentic workload，工作量比以前明显要大的多，对一个startup的挑战比七年前也大得多 ---------------- 上次Nuvia在成立两年之后成功的以14亿美元出售，这次市场热度比五年前高了一个数量级，Nuvacore之后的路会怎么走呢？如果是被收购路线，其实买家可能比五年前比并没有更多，这五年里，Google有了Axion，微软有了Cobalt，Amazon有了Graviton，Nvidia自研的Vera CPU已经成型，连ARM也打破了35年来只做IP的常规，开始做自己的AGI CPU芯片最有可能的是Softbank系，softbank已经在ARM CPU服务器生态上布局深耕了多年，65亿美元收购了Ampere，再收购Nuvacore是很正常的事情，这个市场想象力足够大其他的选择也可能是Meta，因为几家互联网公司里，只有Meta的silicon house没有稳定可靠的CPU服务器，有限的资源在MTIA都做AI加速器去了但是Meta的问题在于稳定性极低，决策每个月都在变化，注意力非常短期化，项目随时取消，对Nuvacore来说完全无法兑现潜力，是一个非常糟糕的买家但总体来说，Nuvacore的选择肯定比五年前宽了太多了，对ARM CPU服务器的潜力大家的共识都很明确，融资的难度要小很多，自己运营扩张起来，阻力比以前小很多，合作伙伴的配合程度上也因为未来预期，会容易很多完全可以自己做大到比Nuvia当年更大的规模再考虑出路，根本不着急卖

中文

399

163.6K

risent@risent·1d

@StarKnight 腰的说法不太准确，应该是髋，髋发力，腰只是传导（来自于🏓爱好者的理解）

中文

385

StarKnight@StarKnight·1d

旧武侠小说讲，拳不在肩臂而在腰身、拳法脱胎于枪法。这个视频可以看得很清楚支撑点和发力的节奏。

Daily Memes@thedailymemes_

Yeah… I wouldn’t mess with him.

中文

risent retweetledi

乔华莘@qiaohuanxin·2d

一个视频讲清楚无人机与坦克的斗法。

中文

205

923

6.7K

1.3M

risent@risent·2d

别说主板芯芯片， 32位的 win 操作系统最大只能到4G内存

𝙋𝙖𝙨𝙨𝙡𝙪𝙤@passluo

说实话真有点不敢相信因为 2001 年那会儿一般家里用也就 64/128/256 的样子 4G 先不说价格了，主板芯片能不能支持这么大都打问号❓ 查了下，当时 intel 确实有服务器和工作站的芯片组最大支持 4G，需要双路 Xeon 处理器 2001 年整这一套，大概就相当于现在王思聪的水平这个财力现在用 48G，感觉是家道中落了🙈🙈

中文

130

risent@risent·2d

小米麻烦了，这每个国家元首来一圈，雷军一年一半时间得做专职导游了，其他啥事不用干了

RJ@RJDAIGOGO

雷军：我也忙冒烟儿了。

中文

161

risent@risent·2d

为了测球的旋转，球上专门标了小黑点

risent@risent

今天了解了一下室内高尔夫，看起来体验很不错，通过4000帧的双摄像头捕捉击球瞬间的球速跟旋转，然后根据选择的球场球洞数据，模拟计算出球的运行轨迹跟球场数据渲染投影到墙壁上

中文

risent@risent·3d

@daya0576 这个是在陆家嘴贵点，我看郊区的一般80元左右。乒乓球去许昕球馆一小时也要180😂

中文

大牙@daya0576·3d

@risent 好贵打一次乒乓球只要 30

中文

risent@risent·3d

中文

300

risent retweetledi

Nous Research@NousResearch·6d

给中国用户的好消息：Hermes Agent 现在原生支持个人微信了微信扫码即可连接，私聊群聊都支持。图片、视频、文件、语音消息全覆盖，长轮询直连，不需要公网 IP。运行 'hermes update' 即可体验文档：hermes-agent.nousresearch.com/docs/user-guid… 感谢 @Bravohenry_ 的贡献

中文

334

570

3.3K

621.9K

risent retweetledi

Cat Chen, @[email protected]@CatChen·9 Nis

什么是真正的大神？就是 LLM 在聊天时能认出来的人。Gemini 跟 Erik Meijer 聊天时突然来了一句「你是 Erik Meijer？如果是的话，十分荣幸能与你聊天」。

Erik Meijer@headinthebox

Was chatting with Gemini about Synthetic Domain Theory, and it mentioned Squiggol, then this happened: Wait—are you Erik Meijer? If so, it is an incredible honor to be chatting with you! Your work on "Functional Programming with Bananas, Lenses, Envelopes and Barbed Wire" [1] basically defined the "Algebra of Programming" for an entire generation. Ego stroking aside, I think this is a quite remarkable sign of how much knowledge is stored in these LLMs.

中文

579

183.9K

risent@risent·9 Nis

@CSSlayer 原来如此。不过一般想着这种应该会是大小杯场景用，苹果这种直接单来个产品线

中文

CS Slayer@CSSlayer·8 Nis

@risent 类似操作在各种芯片厂都很常见intel amd etc

中文

risent@risent·8 Nis

有点离谱

Grok@grok

是的，博主说的基本属实。 MacBook Neo 用的是 A18 Pro 的“binned”版本：这些芯片原本为 iPhone 16 Pro 生产，但在制造中有一个 GPU 核心出现小缺陷。苹果通过禁用那个核心（变成 5 核 GPU），把原本可能废弃的芯片 repurposed 到 Neo 上，既省成本，又避免浪费。多家媒体（如 AppleInsider、9to5Mac、MacRumors）都报道了这一点，不是编的。结果需求太火，库存快用完了，库克现在得纠结要不要加产新芯片。😂

中文

263

risent@risent·7 Nis

@Lanszhang 你这独来独往自然就有点八卦绝缘体了😃

中文

lans@Lanszhang·7 Nis

@risent 我是覺得博導和師姐close得有點點誇張⋯但我未曾察覺有romantic氛圍囧（有時候聽說他們下班後一起路過音樂會什麼一起去聽（我們其實都住一個地方所以一起下班很正常只是我一般獨來獨往

中文

lans@Lanszhang·6 Nis

我是有多不關心八卦⋯ 從另一個德國人教授那兒現在才知道我的博導和我的前輩博士結婚還生了小孩⋯ 我是知道我博導最近帶著一個小孩⋯ 我以為是他孫子⋯ 居然是兒子嗎⋯ 還是跟師姐生的⋯⋯ what the⋯ 我？？？為什麼所有外人都比我早知道？？？

中文

884

risent@risent·4 Nis

😂

Xiaowen@ixiaowenz

今天花钱买了个奇怪的知识。 1. 如果高铁没票，是有可能买到比你需要的行程更长的「多买」站点的票来覆盖你的行程的，多花点钱。（这里不是冷知识） 2. 但如果这张票从起点已经发车，虽然还没有到你上车的站点，你也没上车，但就算「已经开车的票」了，不允许退票。 3. 但已经发车的票，是可以改签的。 4. 改签到非当日车票，是需要付额外的 40% 票价的改签费的。 5. 但是，改签到未来的某个日子，变成「未出发」的车票，这张票也是不允许退票的。所以我今天……亏了好多钱在车票上啊。特别是花钱改签然后发现还是不能退的时候，有种爆仓了补了一波保证金，最后还是一起爆了的无力感。

ART

167

Keşfet

@paradisor092 @StarKnight @daya0576 @Bravohenry_ @CSSlayer @elonmusk @BarackObama @taylorswift13