0xchains

555 posts

0xchains

@0xchains

Blockchain and AI investment in venture team @antalphagroup @BITMAINtech | Make 🍵 @GTCSE @pennEngineers

Katılım Ocak 2022

2.6K Takip Edilen361 Takipçiler

0xchains retweetledi

新闸路摸鱼仔@derek03275486·17h

长鑫IPO真正拉爆的，主要是设备和材料逻辑很简单： DRAM国产化加速 → 长鑫扩产 → 国产设备导入 → 国产材料验证 → 订单释放个股太多了，不一一推荐了，最核心大概这几个，但是市值较大，弹性未必是最大北方华创中微公司拓荆科技华海清科让 GPT 和豆包拉一下 ETF，看了看都没问题，拿不准个股直接上 ETF 就行了 561980 招商半导体设备ETF 159516 国泰半导体设备ETF 562590 华夏半导体设备ETF 159558 易方达半导体设备ETF 588170 科创半导体ETF 注意：要避开半导体全产业链和泛芯片、IC 类的 ETF，这些里面通常包含很多消费电子的票，纯浪费感情

中文

329

49.4K

0xchains retweetledi

一起发财@yiqifacai·1d

其实花几万听课和看我一样的，因为我和叶老师一样也是PCB死多头，我已经喊了很久旗帜鲜明看好PCB生态了，目前从铜箔和电子布切换到CCL 层涨价逻辑比较顺利，铜冠的所有利润我都切换到了CCL生益科技，即使经过回调，生益我依然有超过40%的利润，但是依然没有到我心目中的目标价位。我是定增价248附近入的第一笔胜宏，最近两天的回调中一直在加仓，下周跌还会继续加。一切Rubin延期，未来换玻璃板，碳化硅，PCB没技术含量，英伟达不答应涨价，都是噪音。很快市场就会意识到，PCB就是2025年底的存储。（持仓利益相关，股市有风险，投资需谨慎）

中文

174

27K

0xchains retweetledi

Art of Speculation@ArtofSpecuycky·3d

$AVGO 是AI芯片的龙头。但历史告诉你，真正暴富的人买的是龙二 $MRVL 先说一个关于半导体行业的反直觉规律：在一个严重缺货的市场里，获利最大的往往不是龙头，而是那个追赶中的龙二。（Herman老师分析intel观点我觉得说的很好，也同样非常适用于 $MRVL) 理由很简单：当产能严重不足，买家再也无法只依赖龙头一家供应商。他们开始把订单给原本觉得"不够好"的替代者。而这个替代者，突然发现自己的产品以前没有人要，现在成了香饽饽——价格可以谈，条款可以谈，一切都变了。晶圆缺货时，原本没有人愿意把订单给Intel的客户，开始认真研究18A了。那么，在AI定制芯片这个正在快速缺货的赛道里，获利最大的龙二会是谁？我的答案是 $MRVL 。 1. 先理解结构 AI芯片市场分两层：第一层：通用GPU Nvidia统治，没有任何人能挑战。H100、B200、Blackwell——超大规模云厂商需要它们，别无选择。这层市场已经被充分定价了。Nvidia市值5.7万亿，没有人会漏掉这个机会。第二层：定制ASIC（专用AI加速芯片）这是一个完全不同的故事。每一家超大规模云厂商都在开发自己的专用芯片： Google有TPU（张量处理器），Amazon有Trainium（AI训练）和Inferentia（推理），Meta有MTIA（AI推理加速），Microsoft有Maia（Azure AI加速）。为什么要自己开发芯片？因为通用GPU虽然强大，但它服务所有人，没有为特定工作负载优化。自研芯片可以针对自己的模型架构和推理需求精确设计，功耗更低，成本更低，效率更高。这是一个不可逆的趋势——超大规模云厂商越大，自研芯片的动力越强。但有一个关键问题：这些云厂商需要设计合作伙伴。芯片设计是极其复杂的工程，需要有人懂SerDes，懂先进封装，懂chiplet集成，懂供应链——不是随便一家公司能做到的。全球有能力承接超大规模云厂商定制ASIC设计的公司，只有两家： $Broadcom，和 $Marvell。 2. AVGO vs MRVL：龙头和龙二的真实差距先看数字： Broadcom在ASIC市场占约55-60%的份额，与Google的TPU合作锁定到2031年，客户包括Meta、OpenAI等顶级厂商。Marvell约占15%的份额，排名第二Broadcom领先是事实，毫无争议。但有几个数字值得认真对比： AVGO MRVL 市值 $2万亿 $1,470亿 ASIC市占 55-60% 15% FY26AI营收 $200亿+ $96亿 Forward PE 31倍 36倍 Broadcom在定制ASIC市场记录了约$200亿的AI总营收，而Marvell的AI相关营收约$96亿。从市值角度：AVGO的市值是MRVL的13.6倍，但ASIC市场份额只是MRVL的4倍，AI营收只是MRVL的2倍。这个不对称，是MRVL存在的核心机会。 3. MRVL独特的地方：两场战争同时押注这是我认为最关键的一点，也是MRVL和所有其他AI芯片公司最本质的区别。 MRVL同时押注了两个互相独立的万亿级叙事：叙事一：定制ASIC——去Nvidia化的最大受益者 Marvell的数据中心部门FY2026增长46%，超过$60亿，管理层指引FY2027同比再增约40%。定制芯片年化营收已达$15亿规模，两个AI加速器项目处于高产量阶段，第三个超大规模客户合作正在进行。 Nasdaq 最重要的一个进展： 2026年4月，Google被报道正在与Marvell进行深度谈判，共同开发内存处理单元和下一代TPU，这正是Google此前几乎完全交由Broadcom负责的工作。如果谈判成功，Marvell将成为AI行业最具战略意义的芯片项目之一的核心设计伙伴。这是什么意思？ Broadcom和Google的TPU合作锁定到2031年——这是Broadcom的护城河，但不是MRVL的天花板。Google开始和MRVL谈，不是要取代Broadcom，而是要建立第二供应商。这正是"缺货时代，落后者获利"的经典逻辑。当TPU的设计需求超过了Broadcom单独能服务的上限，Google开始把部分项目分给MRVL。这一单谈成，MRVL同时拥有Amazon和Google双超大规模客户锚定——三个超大规模客户（Amazon、Microsoft、Google）大幅降低了单一客户集中的风险，给市场提供了更清晰的多年营收增长路线图。叙事二：光互连DSP——AI集群神经系统的命门 MRVL是目前唯一同时覆盖定制ASIC设计、1.6T光学DSP、硅光子技术（通过Celestial AI收购）和CXL交换的全栈公司——这是任何单一竞争对手都无法复制的护城河。光互连DSP是什么？当GPU和GPU之间需要通信，数据需要在光纤里传输。但光纤里走的是模拟光信号，计算机需要的是数字信号。DSP（数字信号处理器）就是这两个世界之间的翻译器——它把数字数据编码成光信号发出去，再把收到的光信号解码成数字数据。 MRVL的PAM4 DSP是全球800G和1.6T光模块的核心芯片之一。光互连业务的需求与AI集群的互连基础设施同步扩张——每一个上线的AI集群都需要完整的互连协议栈，不需要等待GPU的供应情况。这是最关键的逻辑： GPU供应有时候是稀缺的，但光互连不等GPU——只要数据中心在建，只要AI集群在运行，光互连就需要。 MRVL的DSP是一个和GPU并行运行的独立需求，不是GPU需求的影子。 4. 我自己的判断：为什么MRVL的故事比AVGO更有弹性 AVGO是龙头，MRVL是追赶者。但在这个特定的历史时刻，追赶者的弹性更大，原因有三：原因一：基数效应 AVGO已经是$2万亿市值，要翻倍需要成为$4万亿的公司。MRVL只有$1,470亿，翻倍只需要$2,940亿——和AVGO现在市值的15%相当。同样的资金流入，对MRVL股价的推动效果是AVGO的13倍以上。原因二：Google的变量 AVGO和Google的合作是锁定的，这是护城河，但也意味着它的上行惊喜已经被充分定价。MRVL和Google的谈判还没有正式宣布——这是一个尚未被市场定价的潜在催化剂。如果Google正式宣布，MRVL立刻拥有Amazon+Google双超大规模客户，ASIC市场份额从15%向25%+跳升的路径被打开。原因三：两个叙事不相关 AVGO的核心护城河是ASIC和VMware软件。 MRVL的两个叙事——ASIC和光互连DSP——是完全独立的业务。 ASIC受益于去Nvidia化，光互连受益于AI集群扩张。两个独立的增长引擎，互相不依赖，互相不替代。 MRVL在多个AI基础设施顺风中同时暴露：定制芯片、光互连、数据中心网络和更广泛的超大规模资本支出周期。这种在AI主题内的多元化暴露，使它成为纯粹的GPU标的（如Nvidia）的有吸引力的补充。 5. 估值合理吗？ $MRVL：Forward PE 36.4倍，市值$1,470亿。 $AVGO：Forward PE 31倍，市值$2万亿。 $MRVL的Forward PE比 $AVGO略高，但增速也更快： $MRVL FY27营收预期：约$110亿，同比增速约40% $AVGO FY27增速约25-30%。PEG（PE/增速）： $MRVL：36.4 ÷ 40 = 0.91, $AVGO：31 ÷ 27 = 1.15 PEG低于1都算便宜。用PEG来衡量，MRVL比AVGO便宜约20%。而且MRVL有Google催化剂这个尚未被定价的变量，AVGO没有。如果Marvell股价涨到$400，需要数据中心营收FY27超过$90亿，Google ASIC合同正式宣布，自定义硅年化营收达到$30亿。在这些条件下，ASIC业务40倍Forward EV/EBITDA，光互连业务20倍EV/Sales。我觉得2027年是很有可能达到的，这还是在理性的估值下，如果是ai融涨疯牛选择忽略估值的话，如果NVDA到360分析师预测最高，也就是8.8T, 我预测8-10T，那么AVGO会到3-4T, MRVL到500B-1T都问题不大。 6. 三个需要追踪的关键变量变量一：Google ASIC合同的正式宣布这是目前MRVL最大的潜在催化剂。谈判已经在进行，但没有正式宣布。每过一个季度没有宣布，市场会稍微失去耐心。但一旦宣布，估值逻辑发生质变。变量二：1.6T DSP的市场份额 Marvell已经开始出货1.6T PAM DSP，基于5纳米工艺，并推出了下一代3纳米版本，将光模块功耗降低超过20%。 800G向1.6T的迭代是MRVL DSP业务的下一个量子跳跃。如果MRVL能在1.6T时代维持甚至提升市场份额，光互连业务的营收会非线性增长。变量三：Celestial AI的硅光子整合 MRVL收购了Celestial AI，进入硅光子领域。这是CPO时代最关键的技术平台——把光学引擎直接集成进芯片封装。如果MRVL能在CPO时代把DSP和硅光子整合成一个完整的解决方案，它的价值会远超现在的定价。 7. 最终判断：MRVL是这轮AI牛市里最干净的不对称机会 AI芯片市场分三类公司：第一类：Nvidia——已经被充分定价的龙头。故事最好，估值最贵，上行惊喜空间有限。第二类：纯ASIC公司（AVGO）——护城河深厚，但增速放缓在定价中。Google TPU锁定到2031年是确定性，也是上行惊喜的天花板。第三类：MRVL——两个叙事都在爆发，Google催化剂未定价，市值基数小。这是不对称机会的经典形态，下行有Amazon锚定，有光互连稳定收入，不会归零，上行有Google合同宣布+CPO爆发+ASIC市场份额提升，估值可能从$1,470亿走向$5,000亿+。 $MRVL也是我重仓持有的标的之一，短期technical角度今天收长上影线，日线级别调整要来，加仓机会在第一目标165，第二目标140。如果给机会到140补那个缺口，我仓位加满（图1）。总结：回到那个反直觉的规律：缺货时代，落后者获利最大。 ASIC市场正在缺货——Broadcom一家根本无法满足所有超大规模客户的定制需求。光互连正在缺货——AI集群每季度都在扩张，DSP的需求只增不减。MRVL是这两个缺货赛道里，那个正在被需要的追赶者。历史一次次证明：当产能不足、供应商只有一两家的时候，第二名是最好的弹性高的投资标的（Nvidia和Amd，TSMC和Intel。）因为所有人都开始认真研究它了。 #MRVL #Marvell #AVGO #Broadcom #ASIC #定制芯片 #光互连 #DSP #Google #Amazon #Nvidia #AI芯片 #半导体 #美股 #龙二补涨 #CPO #硅光子 #AI基建 #USStocks #AIStocks #数据中心 #去Nvidia化

中文

407

50.3K

0xchains retweetledi

Art of Speculation@ArtofSpecuycky·3d

所有人都在买GPU和存储。没有人告诉你光模块公司的总市值比美光还低我想从一个反常识的问题开始：GPU是AI的大脑，存储是AI的记忆。那光是什么？光是AI的神经系统。但神经系统从来不是最先被注意到的。存储已经涨了10倍，GPU更不用说。光的时代，刚刚开始。 1. 先说一个结构性的错误定价在Nvidia的NVL72机架里，光模块的采购金额占到整个机架的20%。2026年全球AI光收发器市场规模预计从2025年的$165亿增长到$260亿，同比增速超过57%——这是半导体赛道里增速最快的子领域之一。但所有光模块公司的总市值，比美光一家还低。这个错误会被纠正。问题只是什么时候。 2. 光和存储不一样的地方存储的接力是季度级别的事件——供需拐点，财报超预期，市场重新定价，SNDK从$200涨到$900，这个过程很快。光的接力是年级别的结构性变迁，因为光的技术路线本身正在发生一次范式转移：第一阶段（现在）：可插拔光模块 800G → 1.6T → 3.2T 线性增长，随数据中心扩张第二阶段（2026下半年）：近封装光学NPO 光模块移向芯片旁边需求非线性跳升第三阶段（2027-2028）：共封装光学CPO 光引擎直接封装进芯片这是终局，也是最大的价值重构 Meta在OFC 2026分享了大量数据，证明CPO比可插拔光收发器更可靠，成本更低，功耗更少。Nvidia在GTC展示了CPO将在2027/28年用于Scale-Up互连。5年内所有AI数据中心互连都将是光。这不是预测，是物理定律。铜在高速率下信号损耗太大，功耗太高，距离太短。光没有这些问题。 3. 光在吃铜，不只是光吃光生成式AI集群需要比传统云服务多10到100倍的光纤，正在把现有铜互连逼到物理极限。这是大多数人没想到的逻辑——光的增长不只来自数据中心规模的扩大，还来自光替代铜的渗透率提升。每一代迭代，光吃掉更多铜的市场。这是双重驱动，不是单一驱动。 4. 产业链七个卡位，从上游到下游现在我来把整条产业链拆清楚。七个公司，覆盖从最上游的衬底到最下游的网络设备。 🔬 最上游：硅光衬底 $SOI 做的是硅光PIC的衬底材料——整个产业链最上游的原材料。没有SOI的衬底，硅光芯片就没有基础。护城河极高，几乎没有竞争对手能短期内介入。和TSEM形成上下游绑定：SOI提供衬底，TSEM代工成芯片。 🏭 代工层：硅光晶圆厂 $TSEM（Tower Semiconductor）硅光版本的台积电。今天刚刚发生的重大事件： TSEM宣布签署$13亿的2027年硅光合同，收到$2.9亿产能预付款，2028年还有更大合同在谈判中。计划资本支出$9.2亿专门用于硅光扩产，Q2营收指引$4.55亿同比增22%。 TSEM最聪明的地方在于：它不赌哪条技术路线赢。可插拔、NPO、CPO，三条路线都用TSEM代工。就算市场对技术路线判断错了，TSEM依然受益。这是光通讯产业链里确定性最高的picks-and-shovels。 💡 激光器层：光的心脏光模块的核心是激光器。没有激光器，光模块什么都不是。激光器分两条技术路线：磷化铟（InP）路线——$LITE（Lumentum） LITE是目前唯一能量产200G每lane EML激光器的供应商，是1.6T收发器的关键零件。Nvidia预先锁定了LITE的EML产能，推迟交货期超过2027年。 Nvidia向LITE投资$20亿，用于加速AI基础设施光学技术。LITE CEO称2026年是激光器芯片销售的"突破年"，刚收到历史上最大的CPO超高功率激光器采购承诺。 LITE的护城河是时间积累的——InP激光器的制造需要极其精密的工艺，20年积累的经验是任何竞争对手短期无法复制的。而且LITE不只押注现在：EML是可插拔时代的命门，ELS外置激光器是CPO时代的命门，OCS光路交换机是未来AI集群的光学路由器。三个产品线覆盖了光通讯从现在到2030年的完整需求。硅光（SiPho）激光器路线——$SIVE（Sivers Semiconductors） Sivers专注于CPO系统的高性能InP激光阵列，Jabil合作是第一个商业验证信号，证明技术正在从研究走向真实超大规模部署。 SIVE不是要打败LITE，而是作为CPO时代激光器供应链里的补充供应商——当LITE和COHR产能不足时，SIVE是下一个选项。整个CPO产业的激光器供应严重短缺，补充供应商的价值会被重新定价。 🔭 光学系统层：从组件到整合 $COHR（Coherent Corp） COHR最新Q3财报：营收$18.1亿同比增21%，数据中心和通信板块$14亿，同比增40%。Nvidia同样投资$20亿入股COHR。COHR是整个光通讯赛道里垂直整合程度最高的公司。从InP晶圆到激光器到光模块到系统，全部自己做。COHR正在扩大6英寸InP晶圆产能，这是推动毛利率持续提升的核心驱动力——规模越大，每片晶圆的成本越低，利润越高。 LITE和COHR的关系是竞争者也是互补者： LITE：激光器专家，EML垄断，聚焦 COHR：光学系统整合商，体量更大，更全面 🏗️ 物理基础设施层：光纤和连接 $GLW（Corning） Corning是光通讯产业链里最让人意外的标的——一家成立于1851年的玻璃公司，正在成为AI基础设施的核心受益者。 Q1 2026光学通信业务增长36%，分部净利润增长93%。2028年营收目标$300亿，2030年$400亿，内含年化增速19%。两个额外的超大规模云厂商签署了长期协议。 Nvidia命名Corning为下一代AI基础设施光连接合作伙伴，投资$5亿+最高$32亿股权，在美国建三座专属光学工厂。 Corning做的是光纤、线缆和连接器——不是最性感的产品，但是不可或缺的基础设施。城市要运转，不只需要主干道，还需要所有的小路、接头、路牌。 Corning做的就是光通讯世界里的所有"小路和接头"。而且这些"小路和接头"是消耗品——每建一个数据中心都需要，每升级一个机架都需要。 📡 网络层：AI时代的网络基础设施 $NOK（Nokia） Nokia是这七个标的里最被市场误解的。大多数人还在用"翻盖手机公司"的眼光看Nokia。 Nokia 2026营收预期同比增长7.5%，EPS增长21.2%，光网络业务增速20%，AI和云业务增速49%，单季度新增€10亿AI和云订单。 Nokia做的是什么？光传输网络（OTN）——把数据中心之间用光连接起来的骨干网络。这是Scale-Across的核心基础设施。 Nokia的第六代超相干光学技术PSE-6s，是目前全球少数能实现800G甚至1.2T长距离光传输的技术之一。 Nokia收购Infinera之后，从"转卖别人芯片的公司"升级为"拥有自己光芯片工厂的公司"——同样的技术路线，市场给LITE估值66.5倍，给COHR估值35倍，Nokia只有30.8倍Forward PE。这个估值差距是最大的错误定价之一。七个标的的完整产业链图最上游 SOI（硅光衬底） ↓ TSEM（硅光代工） ↓ 激光器层 LITE（InP EML，可插拔+CPO） COHR（垂直整合，光学系统） SIVE（CPO激光阵列，高赔率） ↓ 物理基础设施 GLW（光纤、线缆、连接器） ↓ 网络层 NOK（光传输网络，骨干连接）每一层都有自己不可替代的护城河。每一层都在受益于同一个趋势。 6. 为什么是现在？ 2026到2027年是在1.6T供应链建立立足点的关键时期，在一线客户的设计导入将决定长期赢家。现在是design-in阶段——产品正在被超大规模客户选中和锁定。等量产阶段到来，市场才会充分定价这些公司的价值。在design-in阶段买入，等量产阶段收获——这是光通讯投资最好的时机。 7. 仓位逻辑高确定性（重仓）： TSEM → 今天$13亿合同，产业链里最硬的催化剂 LITE → EML垄断+Nvidia锁定，现在到2028年都受益 COHR → 垂直整合，体量最大，Nvidia $20亿入股中等确定性（配置）： GLW → Nvidia直接合作，物理基建不可或缺 NOK → 最被低估的估值，但故事兑现需要更多时间高赔率（小仓位）： SOI → 和TSEM绑定，护城河高但流动性低 SIVE → CPO时代的纯粹赌注 8. 光会接力存储吗？会。但不一样的方式。存储的接力是一次性的价格重估——供需拐点到来，几个季度内完成定价。光的接力是分阶段的持续重估—— 2026年：可插拔1.6T带来第一波 2027年：CPO开始量产带来第二波 2028年：Scale-Up全面光化带来第三波三波叠加，才是光通讯超级周期的全貌。存储让你在一年内赚了10倍。光可能让你在三年内赚同样多，但过程更平稳，确定性更高。最后一句话光通讯不是一个新故事，是一个被重新发现的旧故事。光纤已经存在几十年了，但AI让这个故事的量级发生了质变。每当数据中心需要更高密度、更低功耗、更远距离的连接时，答案永远是光。 #光通讯 #TSEM #LITE #COHR #GLW #NOK #SOI #SIVE #CPO #硅光 #光模块 #AI基建 #数据中心 #存储接力 #Nvidia #美股 #USStocks #SiliconPhotonics #CoPackagedOptics #EML #光互连 #AIInfrastructure #光纤 #Nokia #Corning #Coherent #Lumentum

中文

615

2.1K

595.9K

0xchains retweetledi

168X@168X_Fortune·3d

x.com/i/article/2054…

ZXX

515

1.7K

996K

0xchains retweetledi

花叔@AlchainHust·5d

花了大半天把张小珺访谈姚顺宇的4小时长访听了一遍。这位去年刚从Anthropic跳到Google DeepMind的哥们，参与过Claude 3.7/4.5和Gemini 3。他给了很多实诚的头部大模型一线研究员的视角。访谈信息密度相当高。说几条我觉得最有意思的： 1. Google禁止员工用Claude Code，但姚顺宇保守估计自己90%代码是AI生成的。不保守估计99%甚至100%。一个清华加斯坦福的物理博士、顶级大模型研究员都靠AI写代码，再有人说自己不能用AI写代码，别特么给自己脸上贴金了。但反过来想，Google连内部都不让用CC和Codex，员工效率得受多大影响啊，这家公司真挺神奇的。 2. 他离开Anthropic的原因里，反对Dario反华占40%。他自己说这不是首要但确实是大原因。他很烦Dario那套「我们必须拥有最强模型才能推AI安全」的逻辑。圈里敢直接喷半年前老东家的人确实不多。 3. Claude 3.5/3.6/3.7的命名是个草台班子般的乌龙。Anthropic早期产品力极弱，「居然管两个模型叫一个名字」，外界为了区分自发叫3.6，Anthropic后来跟随社区习惯把下一个叫3.7。我之前一直以为3.6是个跳过的版本号。 4. Claude Code是「个人英雄主义的开端」。一个叫Boris的研究员自己想做提效工具，后来变成Anthropic最重要的产品之一。完全是bottom-up长出来的，不是规划出来的。 5. Anthropic创始团队一个人都没离开。来自OpenAI的那批核心是一起打过仗的，这才是top-down文化能跑通的根。对比OpenAI高管走光，姚顺宇似乎挺鄙视OpenAI的企业文化和部分高管。 6. OpenAI救了Google一命。逻辑挺反共识：如果ChatGPT一鼓作气把search吃了，Google就完了；正因为做出可能性又没做到极致，反而留了Google反击时间。 7. AI行业最重要的特质不是脑子，是靠谱。原话「那些东西多多脑子，本科生就能干」。一个物理博士说这话，算降维打击，也算给所有想转AI的人吃颗定心丸。 8. 他觉得程序员的未来是1/1000拿100倍工资。不是「程序员消失」，是「极度中心化」。绝大多数失去独特价值，少数顶级爆赚。 9. 他觉得现在很多人说的Scaling Law撞墙，多数是自己代码Bug。原话「修一个Bug带来的进展，远大于一些很神奇的技巧」。预训练在过去几个月还在变强，跟外界「预训练已死」的叙事完全相反。 10. 绝大多数New Lab都会死。听完最大的感受是：这哥们说话真的没在留情面，又喷Anthropic又喷OpenAI又喷各种「老登」。但他敢喷的底气挺清楚，既不在SSI那条路上，也不靠LP吃饭。他自己原话说的是：「我这个行业又没什么导师又没什么旧友，我当然想喷谁喷谁。」以及，他在说估计自己也不会在Google待太久，把这话在播客里说出来，我觉得国内头部大模型公司可以去抢一波人了。

张小珺 Xiaojun Zhang@zhang_benita

This episode features an interview with Yao Shunyu @ShunyuYao14 , Research Scientist at Google DeepMind. Yao has held research scientist roles at both Anthropic and Google DeepMind, contributing to the development of key models including Claude 3.7, 4.5, and Gemini 3. Yao Shunyu is not your typical nerd. Every now and then, he’ll catch you off guard with a flash of irreverence. “None of the old guard are your relatives — so if you think someone’s being dumb, they’re just being dumb. Say it. No big deal.” (laughs) “Everyone’s a surfer now, but what really matters is the wave — not the person riding it.” “AI doesn’t actually require that much brainpower — I mean it genuinely doesn’t — most of this is work any undergrad could do. The most important quality in this industry is reliability: being meticulous, and taking responsibility for what you put out.” “You don’t need to worry too much about ruffling feathers with your opinions. As long as your views are internally consistent — not just taking random shots at people, but grounded in your own genuine understanding — there are objective standards for how you’re doing in this field. People will respect you for it.” Let us have a little fun with this one! 😄 youtu.be/ttkd0t5qTD4?si…

中文

345

95.3K

0xchains retweetledi

✧ 𝕀𝔸𝕄𝔸𝕀 ✧@iamai_omni·5d

赏心悦目的技术文章，强烈推荐！

Frank@frank_uid

扒了一下Nvidia近10年算力提升的源头，以及编程模型的变化 research.frankk.site/gpu-architectu…

中文

116

34.3K

0xchains retweetledi

思维怪怪@0xLogicrw·6d

前 Anthropic 研究科学家、现 Google DeepMind 研究科学家姚顺宇，在 @zhang_benita 播客「语言即世界」中首次披露了 Claude 3.7 的内部研发过程。他在 2024 年 10 月加入 Anthropic 后被分进一个名为 Horizon 的团队，当时整个团队只有 10 到 11 个人，却负责 Anthropic 强化学习的全部工作，包括数据、基础设施和算法研究。Claude 3.7 从启动研究到最终发布总共耗时四五个月，前两三个月做算法和数据研究，后两个月做训练和基础设施搭建。 Anthropic 押注代码能力并非一开始就有规划。姚顺宇透露，Claude 3 之所以写代码比 GPT-4 强，背后有一个他无法公开的纯技术原因，是某个团队自下而上做出来的。Claude 3 发布后 Twitter 上的大量正面反馈验证了这一优势，Anthropic 管理层随即把代码能力升级为公司级战略全力押注。他认为 Anthropic 能这样快速下重注，核心在于技术一号位 Jared Kaplan 和 Sam McCandlish 本身就是联合创始人，技术上服众的同时也有权拍板，而 OpenAI 做不到这点，Ilya 在的时候也许行，但后来失去了决策权就走了。当时的 Anthropic 在产品方面几乎没有意识，Claude 3.5 半年内发了两个版本却用同一个名字，最终靠外界起的绰号「3.6」才勉强区分开来。

中文

502

229.2K

0xchains retweetledi

sukie@sukie234·6d

如果你觉得你的生活很无聊你可以去混一混创投圈很多人觉得混创投圈很难其实一点都不难你只需要呆在世界一线城市打开luma 多参加几个本地带有vc pitch/ hackathon/builder/ AI 的活动注册Linkedin 加入所有founder’s group 和学校创业club 每次进门前就默念今天我要加满在场所有人的联系方式散场的时候问一下大家要不要去打德扑/掼蛋不超过一个月你肯定知道创投圈是什么样了你会认识到你这辈子都认识不完的神人威力相当于往微信灌了800个俞浩

中文

178

903

88.5K

0xchains retweetledi

Ace from Money or Life 美股频道@Money_or_Life_X·6d

光！这几天花了不少时间去学习、整理光通讯的知识。现在总算可以说是理解了大部分概念。对于没有时间的朋友，其实看懂了下面两张图，也就差不多可以了。如果你有兴趣阅读Ace总结的全文，请通过订阅我的Patreon获得我的所有文字更新：patreon.com/posts/2026-05-…

中文

197

31.4K

0xchains retweetledi

Berryxia.AI@berryxia·6d

刚刷到CJ Zafir 发了一条关于 fine-tuning 小模型的帖子，看下来觉得这波建议特别实在。他直接说，如果你也喜欢玩开源模型 fine-tuning，那先听听这些：从 1B、2B、4B、8B 这些小模型开始练手，别一上来就冲 27B 以上。云 GPU 用 Google Colab Pro 就够了，A100 80GB 一小时才 0.6 美元左右，小模型完全够用。数据集自己造，用 Codex 5.5 先规划，再配 DeepSeek v4 Pro 生成每一行数据。底座模型推荐 Unsloth 的 instruct 版本，Hugging Face 上直接拉，fine-tuning 笔记也用他们的做参考，直接丢给 Codex 让它帮你改成你想要的配置。他建议花一天时间把这些东西过一遍：SFT、RL 训练（GRPO、DPO、PPO 这些）、LoRA / QLoRA、量化类型、本地推理引擎（llama.cpp）、KV cache 和 prompt cache。他说就直接上手吧，Claude、Codex、ChatGPT 都能给你设计第一步的完整计划。最后他还提到，未来技术会越来越往 5B 到 15B 的 Expert Language Models 走，并非一味堆通用大模型，所以 fine-tuning 这门手艺现在学特别值。很多公司愿意花 5 万美元以上，让你帮他们用自家数据训个性化模型。整条帖子的意思就是：fine-tuning 其实谁都能入门，调模型、测模型、用模型，慢慢就能把这变成一份靠谱的事业。感兴趣的可以看看，还挺有意思。

CJ Zafir@cjzafir

If you love fine-tuning open-source models (like me), then listen. > Start with 1B, 2B, 4B, and 8B models. (Don't start with a 27B model or bigger at first.) > Use WebGPU providers. I use Google Colab Pro for any model smaller than 9B. A single A100 80GB costs around $0.60/hr, which is cheap. Enough for small models. > Don’t buy GPUs unless you fine-tune 7 to 10 models. You'll understand the nitty-gritty in the process. > Use Codex 5.5 × DeepSeek v4 Pro to create datasets. Codex to plan, DeepSeek v4 Pro to generate rows. > Use Unsloth's instruct models as a base from Hugging Face. Yes, there are others too, but Unsloth also provides fast fine-tuning notebooks. > Use Unsloth's fine-tuning notebooks as a reference. Paste them into Codex, and Codex will write a custom notebook with the configs you need. > Spend 1 day learning about: - SFT (supervised fine-tuning) - RL training (GRPO, DPO, PPO, etc.) - LoRA / QLoRA training - Quantization and types - Local inference engines (llama.cpp) - KV cache and prompt cache > Just get started. Claude, Codex, and ChatGPT can design a step-by-step plan for how you can fine-tune your first AI model. Future tech is moving toward small 5B to 15B ELMs (Expert Language Models) rather than general 1T LLMs. So fine-tuning is an important skill that anyone can acquire today. Tune models, test them, use them. Then fine-tune for companies and make a career out of it. (Companies pay $50k+ to fine-tune models on their data so they can get personalized AI models.) Shoot your questions below. I'll be sharing in-depth raw findings about this topic in the coming days.

中文

111

567

73.5K

0xchains@0xchains·10 May

ZXX

0xchains retweetledi

大漂亮| C Labs@giantcutie666·10 May

总结一下AI投资最强00后 @leopoldasch 大佬的观点： 1. 普通人洗洗睡吧，快的话明年，最晚十年内，就都失业了 2. AI基建还有很多钱可以赚，市场大到超乎想象 3.美国的AI技术，很容易就被中国偷，这目前没啥好办法 4.美国要拿出当当年曼哈顿计划造原子弹的决心，all in AI 皇国兴废，在此一战！

大漂亮| C Labs@giantcutie666

x.com/i/article/2053…

中文

225

983

337.5K

0xchains retweetledi

Macro_Lin ｜市场观察员@LinQingV·10 May

OpenAI 跟 Cerebras 那笔 750MW 的合同今年 1 月签的，1 月份报道的合同价值超过 100 亿美元，后来 S-1 招股书披露的 Master Relationship Agreement 总价值超过 200 亿美元（包含到 2030 年的扩展选项）。第一个产品 2 月 12 日就上线了，叫 GPT-5.3-Codex-Spark。这个产品本身就是 Cerebras 推理引擎实战表现的一份成绩单，可以从几个方面做具体判断。吞吐方面，Codex-Spark 在 WSE-3 上跑出 1000 tokens/秒以上，标准 GPT-5.3-Codex 跑在 GPU 集群上约 65 tokens/秒，速度差距 15 倍。Cerebras 自己在 gpt-oss-120B 这个开源模型上能跑到 3000 tokens/秒，是当前所有商用推理服务里最高的吞吐。第三方 benchmark 横向对比，同样 gpt-oss-120B 模型在 Cerebras 跟在普通 GPU 推理后端的吞吐差大约 10 倍。这个 10 到 15 倍的实测差距，跟物理层面 Cerebras SRAM 21 PB/s 对比 H100 HBM3 3.35 TB/s 那约 6300 倍带宽鸿沟之间，还有几百倍的 gap，被软件栈、工作负载、batch 处理这些系统级因素吃掉了。延迟方面，1000 tokens/秒对应每个 token 1 毫秒生成间隔，这个速度的硬件能力反过来暴露了 OpenAI 自己推理 stack 的瓶颈。OpenAI 在 Codex-Spark 上同时引入了持久 WebSocket 连接和 Responses API 重写，每次客户端服务端往返开销减少 80%，per-token 开销减少 30%，time-to-first-token 减少 50%。原来 OpenAI 的整套推理服务架构是按 GPU 推理"几十毫秒一个 token"那个延迟尺度设计的，跟 Cerebras 1 毫秒每 token 的硬件能力对不上，软件栈的开销反而成了瓶颈。Cerebras 的速度让 OpenAI 必须重做整个 web 层，硬件能力升级倒逼软件栈重构。成本方面，Cerebras 的硬件成本优势目前还没有被公开定价验证。Codex-Spark 只对 ChatGPT Pro 200 美元/月订阅用户开放，API 定价至今未敲定。OpenAI 选择高 ARPU 订阅档而不是开放 API 定价，意味着单位推理成本仍然显著高于普通 GPU 推理服务，需要靠 Pro 订阅的高客单价摊薄 Cerebras 的硬件固定成本。如果 Cerebras 真的便宜过 GPU，OpenAI 应该敢把 Cerebras 后端的 API 价格直接公开。延迟披露 API 价格这件事，可以理解为 cost-per-token 还没真正击穿 GPU 推理的成本曲线。作为参考，Cerebras 自己的推理云上 gpt-oss-120B 定价是 $0.69/M 输出 tokens，GPT-4o 的 API 售价是 $10/M 输出 tokens，但两者模型规模和能力差距很大，不能直接对比。但 Cerebras 的这套东西有几个关键的约束条件，框定了它现在能做什么、做不了什么。第一是模型大小限制。Codex-Spark 是蒸馏后的小模型，被显著压缩才能跑进 WSE-3 的 SRAM。WSE-3 的片上 SRAM 只有 44GB，frontier model 的参数量远超这个容量，必须做剪枝或蒸馏才能装得下。换速度的代价是损失约 19 个百分点的模型能力，Terminal-Bench 2.0 上 Spark 约 58% vs 标准 Codex 77.3%。这是 weight streaming 在工程上仍然不够好的旁证，OpenAI 选择用蒸馏小模型而不用 weight streaming 跑大模型，说明前者目前在工程上更可行。第二是容量限制。Codex-Spark 目前是 research preview，OpenAI 明确说明"由于运行在专用低延迟硬件上，使用受独立速率限制约束"。这个表述基本等同于承认 Cerebras 容量稀缺。750MW 全部部署完需要数千台 CS-3，对应 Cerebras 的整机产线是巨大的扩产挑战。这也是招股书里 RPO 约 246 亿美元有 85% 要到 2028 年之后才能确认收入的根本原因，硬件交付的物理速度限制了营收节奏。总结来说，OpenAI 这笔交易对 Cerebras 是阶段性胜利，但远没到终局。技术验证层面，Codex-Spark 证明 WSE-3 在中小模型推理上确实能做到 GPU 做不到的速度，这一点产业内已经形成共识。但商业兑现层面，Cerebras 还要解两个核心问题。一是大模型推理的 SRAM 容量限制，OpenAI 用蒸馏小模型而不用 weight streaming 跑大模型，说明 weight streaming 当前还撑不起完整的 frontier model。二是规模化部署的速度，每台 CS-3 都要一片完整的 5nm 晶圆和一套非标准化的整机集成流程，年产几千台 CS-3 是相当具体的工程瓶颈。对国产推理芯片的同行来说，这件事还有几个很具体的工程信号。端到端延迟优化的价值正在被产业重估。OpenAI 重写整个 Responses API 说明硬件再快，软件栈跟不上的话推理体验仍然受限，专用推理芯片的价值要靠端到端的延迟优化才能完全释放。蒸馏在产业部署里的实际重要性远超学术讨论的程度。OpenAI 这种规模都要为了跑 Cerebras 专门蒸馏模型，说明专用推理硬件 + 专用蒸馏模型这个组合是接下来一段时间的主流形态，单纯的"通用推理芯片"在竞争中会比较吃亏。 1000 tokens/秒正在成为 Agentic AI 工作流的新基准。慢于这个速度的推理硬件在交互式 agent 场景下会被边缘化，这个速度天花板对国产推理芯片是一个相当严峻的目标。 Cerebras 当前展示的能力是真实的，但商业化释放节奏被产能和工程瓶颈卡住了。研究 Cerebras 的真正关键，一是看它在 2027-2028 年能不能把 750MW 真的部署完，把 RPO 真的转成营收；二是看它能不能在 OpenAI 之外签下新的推理大客户。AWS 的 CS-3 上架是一个信号，但目前还没有第二个 OpenAI 量级的合同出现。从 G42 依赖到 OpenAI 依赖，客户质量在提升，但集中度的风险结构没有改变，只有客户组合真正分散了，估值里的风险溢价才能消化。

中文

307

131.3K

0xchains retweetledi

AYi@AYi_AInotes·9 May

Damn，Redis创始人用一个C文件，干翻了大厂烧几十亿的GPU集群。 Antirez，那个写出Redis的传奇黑客，昨天开源了ds4。一个专门为DeepSeek V4 Flash写的原生推理引擎，只有几千行C代码。它做到了一件很多人都觉得不可能的事：把拥有1M上下文窗口、能跑完整coding agent循环的准前沿模型，完整跑在一台普通的128GB MacBook Pro上。 YC CEO Garry Tan看完直接转发，只说了一句话： “正在下载… 1M上下文+可用的coding agent能力，全在一台128GB MacBook上，这太疯狂了🤯” 这已经不是一个普通的量化项目那么简单了铁汁们，属于顶级黑客用极致的系统工程，把闭源实验室烧几十亿才能玩的东西，压到了每个人的笔记本里。他的三个黑客级操作，每一个都颠覆了行业常识： 1. 不对称2-bit量化：只对MoE里占90%体积的专家部分做2-bit压缩，所有关键路径保持全精度。质量损失极小，Antirez本人亲测“coding agent工作良好，能可靠调用工具”。 2. 把KV Cache扔到SSD：很多人都觉得KV Cache必须放内存，1M上下文会直接炸掉128GB内存。他直接把KV Cache搬到了苹果的高速SSD上，用磁盘当扩展内存，彻底突破了硬件天花板。 3. 纯Metal原生优化：没有任何多余的封装，没有通用框架的开销，所有代码只为Apple Silicon写，只为DeepSeek V4 Flash写。实测性能：M3 Max 128GB上稳定27 tok/s。不算快，但对本地跑agent循环来说，完全够用了。你不用再给OpenAI付API费，不用再担心数据泄露，不用再忍受网络延迟。所有的AI能力，完完全全在你自己的电脑里。卧槽，这才是真正的革命，过去AI的权力攥在少数几家大厂手里，他们有GPU集群，定价格，甚至说删就删。现在，一个黑客用几千行C代码，就把这个权力还给了每一个开发者。开源AI真的是不可阻挡的，大厂烧几十亿训练出来的模型，只要权重一开源，全世界的黑客就会用你想象不到的方式，把它优化到每一个能跑的设备上。今天是MacBook，明天是手机，后天是手表，太让人兴奋了！ 2026年5月9日，AI终于从云端的神坛，落到了每个人的笔记本里。或许这一天，会被写进历史！

Garry Tan@garrytan

Downloading now... 1M token context window with supposedly usable coding agent capability all on a 128GB Macbook Pro is 🤯

中文

106

591

3.8K

554.7K

0xchains retweetledi

思维怪怪@0xLogicrw·10 May

MiniMax 发布技术博客，披露其 M2 系列大模型无法输出人名「马嘉祺」的根因排查过程。排查从一个个例出发，最终揭示了一个波及整个词表近 5% 的系统性退化问题。根本原因是大模型两个训练阶段的数据覆盖严重脱节。第一阶段（预训练）用海量互联网文本编出了一本约 20 万词的「字典」；第二阶段（后训练）用精选的对话数据教模型说话，但这份对话数据只覆盖了字典里的一部分。字典里有、但对话数据里没练到的词，就会在第二阶段逐渐被遗忘。「嘉祺」就是这样的一个词。分词器（tokenizer，负责把文字切成模型能处理的最小单元）因为在互联网文本中见到「嘉祺」连用的次数够多，就把它合并成了一个独立单元。预训练时模型学会了这个词，但后训练的对话数据里包含「嘉祺」的样本不到 5 条。后训练不断调整模型参数，练到的词越来越准，没练到的词则在参数更新中被带偏。最终，模型仍然「认识」马嘉祺、能准确回答相关信息，丢失的只是把这个名字写出来的能力。退化排名靠前的还有「传奇私服」「无痛人流」等互联网 SEO 垃圾词。这类词在预训练的互联网语料中铺天盖地，分词器给了它们独立编号，但精选的后训练对话数据不会收录这些内容，结果同样被遗忘。团队对完整词表做了全量扫描，发现约 4.9% 的词发生了显著退化。退化最严重的是日语：29.7% 的日语词显著退化，远超韩语 3.3%、俄语 3.7%、中文 3.9% 和英文 3.5%。日语的严重退化还解开了一个旧谜。此前模型在日语对话中偶尔混入俄语或韩语字符，一直找不到原因。这次分析表明，大量日语词退化后，在模型内部的参数空间里「漂」到了其他语言的地盘上，导致模型该写日语时错写成俄语或韩语。修复方案是构造一份覆盖全词表的合成数据，让模型用简单的复读任务把字典里每个词都练一遍。效果立竿见影：日语回答中混入俄文字符的比例从 47% 降至 1%，全词表参数稳定度从最低 0.329 升至全部高于 0.97。

RyanLee@RyanLeeMiniMax

x.com/i/article/2052…

中文

164

1.1K

262.2K

0xchains retweetledi

Macro_Lin ｜市场观察员@LinQingV·9 May

之前做LLM推理芯片架构探索的时候，我把四大AI推理ASIC公司的架构都翻过一遍。Groq、SambaNova、Tenstorrent、Cerebras。前三家的思路虽然各有侧重，但底层逻辑都在同一个框架里：片上大SRAM + dataflow架构 + 确定性调度，核心差异在NoC拓扑、内存层级、编译器抽象这些维度上展开。 Cerebras是里面让我真正被震惊到的一家，而它却这四家里马上第一个拿到IPO结果的。这家公司的选择比其他三家都激进一个量级：不做芯片，直接做整片wafer。单颗WSE-3，21.5cm × 21.5cm的整片晶圆，90万个PE通过scribe-line stitching在物理上连成一片连续的silicon。这个工艺是Cerebras和TSMC联合定制的，把原本用于晶圆切割的窄条改造成跨reticle的金属导线，让所有reticle在物理上拼接成一整块芯片。（配图二展示了单颗WSE-3内部结构：左半边是整片晶圆的reticle网格和scribe-line拼接，右半边放大了单个PE的微架构。）单个PE的结构极简：8-wide FP16 SIMD计算核，48KB本地SRAM直连，没有cache层级，所有数据访问都是确定性的单周期。加上一个5端口路由器（N/S/E/W + loopback），相邻PE之间的通信延迟也是单周期。关键在于，跨reticle边界的mesh在物理参数上和reticle内部完全一致，编译器和runtime完全不需要感知reticle边界的存在。从LLM推理的视角看，这个均匀性的价值非常大。 LLM推理的瓶颈在decode阶段。每生成一个token，模型权重要被完整读取一次，计算量却很小，典型的memory-bound场景。GPU集群在这个环节的核心问题是数据搬运：HBM带宽有限，多卡之间还要经过NVLink → NVSwitch → InfiniBand → Ethernet四层互联，每一层带宽和延迟都差几个量级，编程模型必须显式处理每一层的拓扑边界。 Cerebras的做法完全绕开了这个问题。单片wafer内部fabric带宽27 PB/s，权重从外部的MemoryX存储集群通过SwarmX流入wafer后，在PE之间按数据流模式传播执行，同一套placement和routing算法跑遍整片wafer。（配图一展示了这个系统级架构：MemoryX参数存储集群到SwarmX互联fabric，再到底层最多2048台CS-3节点，权重广播和梯度规约的数据流方向一目了然。） 90万个PE各自带48KB SRAM，合计约42GB片上存储，每个PE对自己本地SRAM的访问是单周期确定性的，PE间通信每跳single-cycle，延迟和曼哈顿距离成正比。对于推理场景，前提是weight streaming的编译器能把权重有效地分配到对应的PE上，这42GB分布式片上SRAM的聚合带宽远超GPU的HBM方案，没有cache层级带来的访问不确定性，没有跨芯片搬运的开销。回到我自己的体感。做推理芯片架构的时候，NoC拓扑和内存层级的权衡花了大量精力，因为芯片边界是硬约束，跨芯片通信的成本和片内通信之间永远存在断层。Cerebras的做法等于从片内通信的角度消除了这个断层，代价是整条制造和封装链都要重新定义。这也解释了Cerebras的工程取舍。所有架构创新集中在wafer内部，scale-out方向直接复用100GbE + RoCE的以太网生态。wafer内27 PB/s对比跨CS-3的SwarmX在Tbps量级，几个数量级的差距全部交给商品化网络承担。推理场景下单wafer内部的带宽和延迟优势可以直接转化成token生成速度。 OpenAI选择和Cerebras合作做推理，从架构层面看逻辑是通的。大规模在线推理需要低延迟、高吞吐、确定性时延，这三点恰好是wafer-scale架构在片上通信均匀性方面的结构性优势。但这套架构也有几个结构性的问题值得正视。良率和成本是绕不开的。整片wafer做单颗芯片，任何一个reticle的缺陷都影响整体。Cerebras靠冗余PE和路由绕行来应对，但冗余比例和良率数据从未公开过。一片wafer的制造成本本身就远高于切割后卖单颗die的模式，叠加23kW、15U的单系统功耗和体积，部署密度和TCO在大规模推理集群的经济性上面临考验。最关键的是KV cache的容量瓶颈。42GB片上SRAM看起来很大，但长上下文推理场景下KV cache随序列长度线性增长。以Llama 70B为参考，FP16下128K上下文的KV cache就要吃掉约40GB，即使做KV cache量化，长序列场景下的容量压力仍然显著。片上放不下的部分必须依赖MemoryX做外部存储，数据要经过SwarmX回传，这条路径的带宽在Tbps量级，和wafer内部27 PB/s的差距意味着长序列场景下decode速度会被外部带宽卡住。这可能是Cerebras在推理场景面临的最核心的架构约束。

中文

272

31.4K

0xchains retweetledi

思维怪怪@0xLogicrw·8 May

OpenAI 后训练核心成员翁家翌（Jiayi Weng）以个人名义提出了一种名为「启发式学习」的强化学习新范式，并开源了全部实验代码。他用 Codex（GPT-5.4）反复玩 Atari 打砖块游戏，但 GPT-5.4 自始至终没有被重新训练过。真正在进步的，是 GPT-5.4 写出来的那套游戏策略代码。流程是这样的：GPT-5.4 先写一版打砖块的 Python 策略，跑一局，看录像，找出哪里打丢了球，然后自己改代码再跑。经过几轮迭代，策略代码从 387 分涨到了 864 满分。全程没有任何神经网络被训练，纯靠 AI 反复修改 if-else 规则、调落点预测、加死循环检测。最终那套代码包含球路预测器、卡球检测器、回归测试和实验日志，已经长成了一个完整的软件系统。这和传统强化学习的核心区别在于「学到的东西存在哪」。传统做法把知识压进神经网络参数里，人看不懂，学新任务还容易把旧的覆盖掉（即灾难性遗忘）。翁家翌的做法反过来：知识就是代码，人能读、能改、能加测试锁住，不会因为学新东西就丢了旧本领。除了打砖块满分，他还在 MuJoCo Ant（模拟机器蚂蚁走路）上跑出超 6000 分的深度强化学习级成绩，在 Atari57 全套 57 个游戏上逼近了 PPO 基准。但翁家翌也明确画了边界：纯代码搞不定复杂感知任务，比如用 Python 写 if-else 去认图片。他设想的终局是混合架构：底层用轻量神经网络负责视觉等感知，中层用启发式学习处理实时逻辑和安全规则，顶层由大模型审查日志、改代码，再周期性地用底层积累的高质量数据更新自身。过去手写规则之所以被淘汰，不是因为规则没用，而是人类维护不起。现在 AI 写代码够快够好，这条老路重新走得通了。

Jiayi Weng@Trinkle23897

Codex grew programmatic policies with no neural nets: max score on Breakout, and SOTA-level scores on MuJoCo. Maybe heuristics were not too weak. Maybe they were just too expensive to maintain. Maybe it's the next paradigm. trinkle23897.github.io/learning-beyon…

中文

227

1.5K

340.2K

0xchains retweetledi

华尔街观察 Xtrader@cnfinancewatch·8 May

这个观点是对的：光模块其实不对应该是交换机 asic。数据流量越来越恐怖。intc avgo 几乎是必胜。

中文

124

52K

0xchains retweetledi

vLLM@vllm_project·6 May

🚀 New on the @vllm_project blog: Serving Agentic Workloads at Scale with vLLM x Mooncake. Agentic traces grow to 80K+ tokens with 94%+ reusable prefixes, but local KV caches evict them and cross-instance routing misses them. By integrating Mooncake Store as a distributed KV cache pool, vLLM gets: 🚀 3.8x higher throughput ⚡ 46x lower P50 TTFT ⏱️ 8.6x lower E2E latency 📈 Cache hit rate 1.7% -> 92.2% 🌐 Scales near-linearly to 60 GB200 GPUs at >95% hit rate 🔥 Powered by a deep collaboration between @Inferact and @KT_Project_AI 📖 Read more: vllm.ai/blog/mooncake-… 🧵👇

English

193

28.2K

Keşfet

@zhang_benita @leopoldasch @vllm_project @Inferact @elonmusk @BarackObama @taylorswift13 @cristiano