Ted

275 posts

Ted

Ted

@Riovipvip

China Katılım Mayıs 2013
289 Takip Edilen60 Takipçiler
Ted
Ted@Riovipvip·
@_FORAB 我每周都会吃大量毛肚
中文
0
0
2
1.3K
AB Kuai.Dong
AB Kuai.Dong@_FORAB·
特朗普贸易顾问说,中国主要增加买的是内脏,而不是美国农场主更希望卖出的高端牛排、汉堡肉等。 弱弱地问一句,这不就是牛杂么?? 牛杂确实是高需求哇。
AB Kuai.Dong tweet media
Meguro-ku, Tokyo 🇯🇵 中文
105
17
260
79.5K
Ted
Ted@Riovipvip·
@Trader_S18 这里面存在的交易机会是什么?
中文
0
0
0
1.7K
TraderS | 缺德道人
TraderS | 缺德道人@Trader_S18·
刚刚的弹窗消息:美国30年期国债收益率持续走高,升至5.181%,续创2007年以来最高水平。美国10年期国债收益率上升至4.663%,为2025年1月以来最高水平。 在这种情况下,要么宰了日本,让日央行彻底放弃维护日元汇率,停止抛售美债,当血包供血 要么给伊朗一个大礼包迅速开放海峡,除此以外别无他法 所谓北约派兵就是纯笑话,年初保卫格陵兰岛的时候除去美国以外的联军就凑了几十个人,搬砖都嫌不够用。 还有个办法就是沃什这边也别再吓唬市场要加息了,赶紧麻溜出来说上任之后马上着手准备开始降息也能短期内环境市场焦虑情绪。 不管采取哪种办法,本周应该就会有消息出来,顶着这么高利率的美债,美国经济金融随时都得高血压倒地 期待美版YCC尽早落地,到时候币圈好日子也许就来了
TraderS | 缺德道人 tweet media
TraderS | 缺德道人@Trader_S18

下午才说完美债收益率的事,晚上这就又爆表了,这几个指标一个比一个难看。。。马上美股要开盘了,自求多福吧

中文
40
18
182
91.9K
库哥
库哥@kugo_A10·
今年A股最可惜的一只票, 就是三安光电。 前几年, “中微公司”的创始团队 想见三安老板, 都要费很大劲。 我在18.3元高位卖掉, 后面最大回撤接近30%。 主要还是担心, 公司历史包袱太重。 前阵子我发推提过, 创始人牵扯高官落马事件, 结果没多久, 就被留置调查。 不然今年AI光芯片风口, 只要能沾边的杂毛, 基本都在暴涨, 更不用说三安这种第一梯队。 国内光芯片的绝对龙头, 也是唯一的全链路玩家。 手里握着“光模块”两类 最紧缺的核心材料: EML光芯片、 磷化铟衬底。 从产业战略来看, 三安在碳化硅这块, 也是国内的核心玩家。 控股权这块, 官方大概率不会让其他民企介入。 当时说的“国有化”, 现在还真TM有可能成真。
库哥 tweet media库哥 tweet media
库哥@kugo_A10

三安光电当年是全球 LED 芯片的绝对龙头。 林秀成十年前 200 亿身家,就成为福建首富。 那时候还没有张一鸣什么事, 更没有今天这种互联网巨头的格局。 当年国内半导体高端设备, 被美国 Veeco、德国爱思强几乎垄断。 中微公司的 MOCVD 想进三安光电的工厂, 没有产业基金推动, 连测试机会都很难拿到。 2017 年那波惨烈下跌, 三安大股东高比例质押,又牵涉到巨额连带担保爆雷,王三运、陈树隆落马。 资金链一度极度紧张, 三安光电差点就被国有化。 今天光学光电子板块爆发, 市场炒作MicroLED CPO 新概念 但三安光电的基本盘,还是 LED。 是非常典型的强周期行业。 近期策略还是,热点来了积极参与,但绝不入戏。右侧交易赚到的利润, 逐步去布局左侧的房地产周期见底。 6 月份之前, 全国性收购存量房的细则100%会出来。 以后每当一个板块爆发, 我就聊聊这些龙头公司的发家史和产业沿革。 上市公司这些年接触过不少, 没有几百家,起码也有上百家。

中文
31
17
124
221.1K
Chris Lee
Chris Lee@ViewsOfChris·
光模块business timing和market timing - By Frank 他对存储和光模块的对比,把规模解释的很清晰。 现在解答了CPO的scale up 路程时间点。 Frank 是个事实求是的人,看数据、看时间段,不哗众取宠,才华横溢,又朴实谦虚,只有谦虚,才能激起对知识的渴望和求真欲望,而谨慎是严谨求证,validation。 Frank 代表我们每一个普通人,通过深入研究,了解产业链,理清关联逻辑和时间点!这是最重要的,投资里的business timing和market timing 其实很重要。 向Frank学习, 文章值得细琢。
qinbafrank@qinbafrank

x.com/i/article/2056…

中文
7
44
165
82.1K
XTrader猫姐美股交易
XTrader猫姐美股交易@maojietrading·
LITE周一跌破21日线,庆幸之前跑了,上周一那根大阳线也当作视而不见。原因发过了,到达盈利目标,同时感觉动能不太好,起码和存储半导体之类的差很多,不过最终忍住了没做空,不然又是一笔收益。 当下美股高位整固,新开仓都比较难,一根爆量大k随时掀翻,还是小心为妙。
中文
1
1
96
25.7K
加州旅馆
加州旅馆@henghaer123·
@Riovipvip 盘子小有可能,但澜起兆易这种并不是,更像宁王的那种溢价,是外资买的
中文
1
0
0
199
加州旅馆
加州旅馆@henghaer123·
因为当时存储仓位过大,并且没有仔细研究,错误的将澜起科技一家做内存接口的公司归类为存储公司,在五一节前不到300卖飞了。澜起科技表面看是绑定存储公司,但实际上是解决的问题是AI服务器中数据高速互连需求,其实更像美股的 $ALAB 。中国少有的头部并且有价值的芯片设计公司,而且在光取代铜的故事里,它作为数据连接底座,并不会受到影响。看看这波回调能不能重新接回来
加州旅馆@henghaer123

富途没中签,149暗盘买了澜起科技,感觉要挣钱!和上次的兆易创新一样。A股的公司来港股是有的来骗钱,有的是来送钱,一定要分辨清楚

中文
10
10
67
25.7K
Jingle Bell 初号机
Jingle Bell 初号机@ScarlettWeb3·
"不承担风险和波动,就拿不到收益,否则拿收益太简单毫无代价" “行动力>择时” "有我在的群,就会是美股群" "做空英伟达的人才卖课,做多都是躺赚" "短期博弈不是承担风险,而是逃避风险" 蒸馏了字节投资传说 @dexteryy 在字节区块链 / AI群半年的 2000 多条发言 作为字节内部《杨学笔记》的作者,10年长拿英伟达扛过最多 73% 回撤最终吃满 2000% 杨是一名强 AI 超级周期信仰者 + 高风险偏好成长型投资者 GPT 对他的评价是体系极度内部自洽,本质上接近“AI 版木头姐 + 半个纳指巴菲特” 杨的很多观点是从“技术演化路径”而非“传统价值投资”出发,投资方向偏“长期 Beta + 少量认知 Alpha” 【 或许你也想学习他的投资思路?字节文档可对外版:bytedance.sg.larkoffice.com/docx/QZGVdgXgo… 】 感谢 @riba2534 杨在群里回复过很多群友关于问他投资的问题,他都会回:“看你这部分钱是用于做什么的” 如果是用来投资的,是否能保证5-10年这笔钱不用。如果这笔钱是生活的,操作肯定不一样。 认识杨哥,我学到的最深一课就是:“止盈是散户最大陋习” 何时卖?“需要现金时卖,用多少卖多少” “交易系统要强一致,不能凭感觉这次卖下次不卖” ⚠️ 以下是深水区:⚠️ 我觉得杨哥在文档中过于绝对的部分在于 “始终满仓 + 20–40%杠杆” “不懂杠杆就只能永远做类奴隶阶级” 这是他体系里相当危险的部分,谨慎抄作业 因为:杨是幸存者,以及他能确定自己看得准,而你不一定行。 如果你拿的是 NVDA、TSLA,在AI 主升浪这一波,杠杆会神化你的收益。 但问题是:你无法提前确定自己拿的是“未来 NVDA” 想想看,Unity、Roblox 这种元宇宙相关,在某些阶段是不是也看着“特别像未来?” 杨关于 AI infra 和 AI NeoCloud” 的逻辑,我认为也是相对于高风险偏好成长型的,仁者见仁,智者见智! 总之,学习和观察一个人的逻辑,尤其是投资逻辑,非常令人受教 杨一直说,多和 GPT 交流,首先你的思路要自洽~ 老师在群里还一直在告诉我们「 卖出互联网老登股 」 ,因为在通用 Agent 里集成软件 vs 在软件里集成 Agent,后者意味着收缩、关停、吞并 「 美团。。腾讯。。uber。。是最可能遭遇范式颠覆的 (APP入口被 Agent 入口冲击)」 那么问题来了,你手上的持仓,在他的看空清单里吗?🤡
Jingle Bell 初号机 tweet mediaJingle Bell 初号机 tweet mediaJingle Bell 初号机 tweet mediaJingle Bell 初号机 tweet media
中文
27
9
65
4.4K
RamenPanda
RamenPanda@IamRamenPanda·
人们好奇我最近为什么专注于非美国市场。 为什么?CPO 是我的 #1 主题多头。 市场尚未察觉,光子学领域的突然范式转变…… 我是少数提前布局 2025 年当前超级周期的人之一,当时在 X 上以 $AAOI @ ~$30、$LITE ~$300s 和 $AXTI ~$13 的价格…… 而且有其他人无法展示的实际收据和论据。 CPO 从 ~$0 跃升至 910 亿美元的总可寻址市场机会。 根据 GS 研究,在接下来的 1 年半内。 同时整体光学市场达到 1540 亿美元。 许多玩家对当前光子学周期几乎没有曝光: -> 在欧洲,像 $SIVE 或 $SOI 这样从事高端激光设计和衬底的公司。 -> 在台湾,Foci (3363)、Nextronics (8147)、Shunsin (6451) 等公司从事光学组件和代工厂。 -> 在日本,从事激光量产、衬底和化学品的公司。 它们突然成为 CPO 的主导玩家。 至于美国玩家,曝光度不高。但现有玩家如 $LITE、$COHR 仍将从 CPO 中获得上行空间,因为这是它们的新增长向量。 我对当前玩家的逆向思考过程: 大多数的估值已计入巨额传统可插拔收入,这些收入将不可避免地随着时间推移面临蚕食,因此除非有人使用杠杆,否则重新评级的潜力有限。 许多这些更纯粹的 CPO 标的将从 0 迅速飙升至 100,一旦 2026 年下半年开始量产,用于扩展规模(作为收入桥梁),进入 2027 年下半年用于提升规模(大规模增长驱动)。 市场通常会提前 8-12 个月定价…… 尽管在那之前有任何市场波动,我对供应链研究的主题信念依然坚定。
Serenity@aleabitoreddit

People wonder why I'm focusing on non-US markets recently. Why? CPO is my #1 thematic long. Markets don't know yet, the sudden paradigm shift in photonics... I was one of the only to frontrun the current supercycle in 2025 w/ $AAOI @ ~$30, $LITE ~$300s, and $AXTI at ~$13 on X.... With the actual receipts and thesis that others can't show. CPO goes from ~$0. To $91 Billion TAM opportunity. In the next 1 1/2 years from GS research. While overall optical market reaches $154B. Many players that had little exposure to the current photonics cycle at all: -> In Europe with high-end lasers design like $SIVE or $SOI with substrates. -> In Taiwan with Foci (3363), Nextronics (8147), Shunsin (6451) and others for optical components and foundries. -> In Japan with laser mass production, substrates, and chemicals. Are suddenly the new dominant players for CPO. As for US players, there's not much exposure. But the existing ones like $LITE, $COHR still get upside from CPO as that's their new growth vector. My contrarian thought process on current players: Is that most of their valuation is priced in huge legacy pluggable revenue that will inevitably face cannibalization over time, so re-rating potential is less unless someone uses leverage. A lot of these new purer play CPO names go from 0 to 100 extremely quickly one mass production starts H2 2026 for scale out (as a revenue bridge) into H2 2027 for scale up (massive growth driver). Markets usually price things in 8-12 months ahead of time too... I have high conviction thematically in my supply chain research despite any market volatility leading up until then.

中文
6
9
49
20.1K
RamenPanda
RamenPanda@IamRamenPanda·
散户抱怨为什么自己抓不住AI大牛股? 不如我们先看看这样的牛股是如何诞生的 你本是一家做数据线做激光的小公司。你的业务平平,营收一般,股价也属于penny stock垃圾股。突然有一天,AI被发明出了。因为AI对激光模块的需求暴增,你公司营收也暴增翻倍再翻倍。嗅觉灵敏的机构发现因为AI,你公司业务转型,估值也给你从垃圾股转换成了科技股 所以,看懂了吗? 所有AI大牛股的特征都是跨界转行--不相关行业因为AI的需求歪打正着,出货供不应求,营收利润暴涨 你要发现这样的公司,必然需要每天都泡在行业研报里钻研AI的发展趋势 然而散户你呢,不学无术,上X看垃圾KOL的垃圾输出,只等着别人喂饭,但被喂的确是全错的认知,就这还想发现买到AI大牛股发财? 做梦呢
中文
8
4
113
26.2K
川沐|Trumoo🐮
川沐|Trumoo🐮@xiaomustock·
基于此想到一个提前获知存储股市场动态变化的渠道方法。 通过韩国海关总署 (KCS)官网和韩国贸易统计推广院官网每周每月实时查询。 1. 韩国海关总署 (KCS) 海关总署会定期发布趋势分析报告。 官方网址: [tradedata.go.kr] 披露内容: 每月的 11日 和 21日 会发布《进出口现状》简报(包含半导体单列数据),每月 15日左右 发布上月的详细最终统计数据。 2. TRASS (Trade Statistics Service) 这是由韩国贸易统计推广院(KTSPI)运营的最权威、细致的查询平台。 官方网址: [trass.or.kr] 操作方式: 在“Trade Statistics”或“Export/Import by Item”菜单下,通过 HS Code(海关编码) 进行检索。 关键编码参考:  SSD(固态硬盘): HSK 8471.70.4010。  HBM(高带宽内存): 通常归类在 HSK 8542.32(DRAM 存储器)下,更精确的动态需组合查询其 10 位编码。  数据逻辑: 获取该月度或旬度的“出口金额”与“出口重量/数量”,两者的比值即为 出口单价。
川沐|Trumoo🐮@xiaomustock

韩国海关数据印证了ssd需求已经在反超hbm, 好消息是存储三巨头,三星海力士美光依然是ssd垄断者。

中文
15
129
762
184.8K
fin
fin@fi56622380·
@Freedom12282341 出去玩一个月,所以失踪了,买的几个VPN太难用了,总是要刷新很多次才能连上一次
中文
2
0
5
1.2K
fin
fin@fi56622380·
回顾2025年半导体市场,真的是有太多太多精彩的故事,最大的主题就是: AI需求驱动导致半导体基建的估值体系重构 + 产业链的价值分配重写 从2024年开始,半导体基建正在飞速吞噬整个IT产业利润,SP500里半导体净利润EPS在IT行业里占比,在两年时间从不到20%上升了到了40%,而且还在呈加速上升姿态 半导体整体前瞻利润率从2023年的25%已经升到了2025年11月的43%,已经明显超过了几个互联网巨头的平均利润率,这也印证了半导体利润率超过互联网会是新常态。整个IT产业的利润分配,流向半导体的比例越来越大。 要知道,就算是20~22年的半导体芯片荒,短缺如此严重,半导体的利润率和整个IT利润分配也没有显著增长 这就是故事的上半篇:AI需求驱动导致半导体基建的估值体系重构,不再是互联网时期的基建从属地位 ------------------------ 这个现象背后的逻辑是商业模式随着技术特性的变迁: 互联网时代,每次请求的网络和算力成本,边际成本极低,scaling的效果极好,分发的边际成本几乎为零 在AI时代,这个互联网时代分发边际成本几乎为零利于scalable的特性遭遇了根本性的重大挑战:且不说训练成本从此不是一次性开销而是年年增长,就客户的AI推理请求而言,由于inference scaling成为共识,加上垂直领域仍然需要更大规模的旗舰模型来保持竞争力,推理的成本不会随着硬件算力价格的通缩而同步降低 互联网企业从前的最大成本只有OPEX尤其是SDE人工成本,而现在,互联网公司历史上第一次像半导体厂foundry那样背上高折旧成本的资产负债表,商业模型恨不得要慢慢从“流量 × 转化率”部分转向“每 token 毛利”了 简单的说,互联网时代到AI时代的成本分布,在人力成本opex的基础上又加上了沉重的硬件/算力成本capex(财报里占比:MSFT 33%, Meta 38%)。 上个时代的互联网公司+CSP+SAAS是收租行业里的大赢家,而AI时代,算力(半导体/芯片折旧)成为了新的收租行业,整个IT行业的利润分布发生了剧烈的重新分配(EPS利润流向半导体从20%升到40%而且持续攀升中),这就是半导体基建估值体系重构最重要的原因 --------------- 半导体高利润率的新常态趋势能持续多久? 目前的高溢价来自于前期不计成本的军备竞赛造成的半导体订单积压过多 但很显然,hyperscalers都不愿意当冤大头,都在试图自建ASIC降低成本,那么可以从2030年远期的算力分布来回看这个问题 长线来看,openai已经明牌了标准答案,10GW Nvidia,10GW ASIC,6GW AMD,其他hyperscaler划分比例有类似考虑 比如说,推理端希望ASIC >50%,GPU里再细分的话,AMD和NV(legacy)对半分。训练还是得NV占大头,60%+,剩下的自研ASIC和AMD对半分 2030年按60%推理,40%训练比例划分,算下来NV 38%, ASIC 39%, AMD 23%,跟openAI比例是几乎完全一致的,算是一个标准答案参考值 当然了,微软,Amazon,Google,Anthropic这几家里AMD的比例会比这个标准答案中枢/参考值明显低一些,xAI则是没有ASIC只有Nvidia+少量AMD AMD的风险在于,当2030年再往后的更长期,CSP的in house ASIC越来越成熟(微软除外),推理端ASIC占比可能越来越高,很难有incentive新买入大量GPU了,除非卖的足够便宜 最近风头正劲的TPU呢?Meta是不是要转向TPU?对Nvidia的利润率影响大吗? 实际上,Meta今年capex72B,明年capex110B,未来六年capex平均值可能达到160B附近,而Meta 6年10B的TPU订单算下来年均只有1.6B,而且购买的是TPU云服务,并不是裸TPU 也就是说,Meta这笔TPU订单只占到Meta未来6年capex的1%,并没有严肃的考虑大规模部署,可能只是作为和Nvidia讨价还价的手段而已 另外从Meta最近几个月的招聘广告来看,也并没有看到任何TPU engineer方面的招聘,不像 Anthropic那样从五月就招一堆TPU kernel engineer,十月才宣布大规模采购TPU做训练 所以说,不管原因是diversify供货商,还是给自研ASIC延迟做退路,还是因为AMD的MI350X延迟,Meta买TPU基本上只有一个考虑:增加买Nvidia GPU的议价权,但顶多只有推理份额里能讨价还价,实际效果很有限,对Nvidia利润率影响也很有限。 要知道,22年加密货币熊市矿难的时候,NVDA库存上升到了198天,利润率只是从65%回撤到了56%,算上PE/宏观双杀股价才从300变100,现在一直供不应求,利润率没道理能降下来 再加上TPU v8设计过于保守(没用HBM4),Kyber rack的Rubin方案会比TPU v8的TCO更好,到头来最后还是得继续依赖Nvidia,很难议价。只要Nvidia继续保持这样的大踏步前进,竞争对手其实要跟上还是不容易的。 总之,一方面,全产业链瓶颈,比如cowos扩张都很谨慎,供不应求的状态还能持续多年。 另一方面,AI变现的利润曲线和硬件投入曲线存在“时间错配”,应用端的增长曲线会落后几年,只要这个应用端和基建端的增长曲线的时间错位依旧存在,半导体在IT行业的利润分配就会一直占优势。 从OpenAI的到2030年的投入曲线来看,这个时间错位至少要持续到2030年附近。也就是说半导体行业的超级扩张期带来的在IT产业利润划分的主导地位,目前看至少能持续到2030年 而半导体高利润率可能会维持的更长远一些,因为从互联网时代一次性基建属性变成了现在的收租基建属性 --------------------------------------------------- AI 不是只养活了 GPU,而是在用算力预算把“能把电变成 token 的每一环”都抬了一轮,从内存,存储,互联,光纤,电力,储能…..等等 上半篇讲完了“半导体吞噬IT利润”,那么下半篇讲的就是“AI算力价值溢出效应(Spillover Effect)重塑半导体内部格局”:GPU算力增长 -> 内存/存储/互联/CPU瓶颈 -> 溢出效应 -> 结构性机会 2025 年更有趣的故事,是巨大的行业红利在半导体内部怎么诞生结构性新机会,比如说,一个super cluster需要几个数据中心互联,光纤互联的长度需要上百万mile这个级别,这就是新机会 半导体产业链的结构性趋势带来的新机会,最典型的例子就是内存(DRAM/HBM)和存储(SSD),HBM的需求增长太夸张,连带挤压DDR4/5产能,直接让以周期性为标志的内存行业甚至喊出了“周期不存在”了,Hynix因为在HBM上领先,甚至都开始憧憬起了几年后年利润1000亿美元,妥妥一个万亿市值的公司 这两个板块背后,是结构性趋势的转变:AI workload从训练逐渐往推理延申,推理比例越来越大。 而推理是一个非常纯粹的吃内存带宽速度(memory bound)的事情,可以说带宽速度=token/s。模型尺寸越来越大,以及上下文context length的增加,对内存的尺寸要求也相应增大,导致了内存的需求激增:推理即内存 下一代的的GPU/ASIC内存已经成了暴力美学,配备的内存size之巨大,是三年前无法想象的,回看22年H100的80GB简直像个玩具,这才几年就增长了十倍: Nvidia Ultra Rubin - 1024GB HBM Qualcomm AI200 - 768GB LPDDR AMD MI400x - 432GB HBM 内存的另外一个潜在的爆发点在端侧,也就是手机/PC/汽车/机器人的端侧LLM,这两年主流的手机旗舰机已经从6GB升级到了8GB/12GB/16GB,提前为可能的端侧LLM生态做准备,毕竟手机算力下一代就能达到150TOPS量级,妥妥的桌面级,非常暴力 潜力上来说,端侧内存升级是比云端内存增量要更大的市场,毕竟端侧终端device的数量太惊人了,每年都是billion级别,一旦端侧LLM生态繁荣起来,内存用量翻倍轻而易举,针对端侧低功耗内存/存算一体的各种设计都会跟上 但端侧genAI的软件生态,似乎明显滞后,一直比我想象的进度要慢,可能是因为这方面还处于摸索期,并没有云端那么确定的ROI,厂商们在投入上都很谨慎,我在23~24年时候看好27年,可能还是太乐观了 互联网->移动互联网用了10~15年,端侧genAI/LLM可能也需要7~10年,可能得等云端ROI开发的差不多了,边际收益下降了,才能轮得到端侧genAI/LLM拿到开发资源,跑通端侧ROI。 -------------------------------------- 另一个2025年半导体内部结构性转变的故事是NAND存储,特别是企业级eSSD硬盘 结构性趋势来源也是同一个,AI workload的推理需求越来越大。内存红利也外溢到了SSD存储,甚至HDD存储,因为内存不够用就用高速SSD作为多级缓存 主要逻辑是AI推理过程中内存溢出KV cache offloading到下一层SSD存储,以及向量数据库检索/indexing,都在增加SSD存储的需求 Micron财报说的精准又直白:“AI inference use cases such as KV cache tiering and vector database search and indexing, are driving demand for performance storage.” 至于为什么存储价格在第四季度才爆发,这需要区分一下合约价格和现货价格,合约价格涨幅会温和一些,就算是最紧缺的企业级eSSD合约Q4上涨大概25%。而当NAND产能在2025年被合约慢慢的吃光,现货的价格就造成了观感上强烈的冲击,一个月上涨50%以上。 另一个未经验证的逻辑是多模态的爆发,特别是AI图片和AI视频的需求爆发,也会加剧存储的短缺,我觉得这条线只能说未来可期,但目前的视频/图片精细程度,可能还不到当年GPT3的水平,要达到出圈效果还需要一些时日。 ------------------------ 那么下一步还有什么趋势转移带来的半导体结构性的机会呢 那么就要先看下一步AI推理端的需求趋势是什么,毫无疑问,agentic flow的比例会越来越大,2025并不是year of agent,而是一个decade of agent 从CPU视角去看agentic workload,routing和工具处理都在CPU上,如果把常用的agentic框架做profiling,比如SWE-Agent, LangChain, Toolformer,CPU最长可以占到90%的E2E端到端延迟,throughput瓶颈也更多的卡在CPU,甚至CPU能耗也超过了总能耗的40% Agentic AI目前是一个CPU瓶颈更多的事情,在 agentic 框架里,CPU 是永远在忙的总指挥orchestrator, 很可能会成就CPU需求的新一波回暖 AMD 2025年Q2财报(8月5日),Lisa Su明确表述了这一现象:​"In particular, adoption of agentic AI is creating additional demand for general-purpose compute infrastructure, as customers quickly realize that each token generated by a GPU triggers multiple CPU-intensive tasks." "agent AI的采用正在对通用计算基础架构产生额外的需求,因为客户很快就意识到GPU产生的每个令牌都会触发多个CPU密集型任务。" ​Q3 财报里Lisa又明牌了一次CPU TAM increasing due to Gen AI. "Many customers are now planning substantially larger CPU build outs over the coming quarters to support increased demands from AI, serving as a powerful new catalyst for our server business." Nvidia也是把agent flow视为CPU需求,GB200/300 架构配置的CPU比例也比以往大的多,36颗 Grace CPU : 72颗 Blackwell GPU,直接达到了1:2的水平,AMD的路线则是用1~4个256核的EPYC去服务MI400系列72~128个GPU 以后的硬件架构,一定会往优化agent workload方向发展,比如agent task graph的调度和load balancing,CPU/GPU协同micro-batching 算力上的比较,说不定以后也会摆脱现在的纯GPU token rate比较,转向整个系统级全栈agentic benchmark比较. -------------------------- 半导体结构性转变带来的机会同时,下一步,可能也会带来一些意想不到的次生效应 云端AI数据中心需求爆发,造成内存和存储的暴涨,给消费电子的成本带来了很大压力,在2026年,这也许会演变成消费电子产业潜在的黑天鹅 PC厂商最近的股票大跌,也是这个原因。HP已经说了要减少内存配置,暗示要把PC重回8GB内存+256GB存储的时代了。 DRAM内存和存储再这么涨下去,可能会出现很离谱的情况:内存/存储现货价格比CPU和GPU还要更贵。尴尬的是,这可能直接延缓了消费电子期望的AI PC的进程,毕竟大内存是更有利AI PC的表现力的。 夸张的说,每个PC厂商和手机厂商的员工,甚至是消费电子厂商的员工,都应该买入存储和内存,作为职业风险对冲 明年年初开始,安卓阵营的内存以及存储成本要压不住了,三星,小米的手机售价都提高的话(美国市场现在已经提高不少了),利好最大的就是苹果 苹果的内存产能,nand产能都是专属长约锁价特供的,顺带还把Kioxia给坑了好多不涨价产能,导致苹果的成本优势进一步扩大,苹果全球手机销量市占率增长可能会非常可观,接下来一阵子可能会是iphone辉煌的时光。 ----------------------- 2025年半导体市场真的是太多精彩的故事了,Nvidia/AMD/TPU和各家hyperscaler的恩怨情仇引得各路下注的吃瓜群众心情跌宕起伏。 HBM/内存厂商吃到了memory-bound的红利,NAND厂商意外收获了KV cache的溢出效应,CPU在沉寂近十年后,可能会因agent orchestration再次回到增长叙事的中心 不再是Nvidia/AVGO几家算力厂商独大,而是AI workload算力价值溢出后的每一次演进,从训练到推理,从文本到多模态,从单模型调用到agentic flow,都在重写产业链的价值分配。 云端AI的繁荣正在挤压消费电子的生存空间——当PC厂商被迫讨论重回8GB时代,苹果却因供应链优势坐收渔利。这场算力军备竞赛的次生效应,可能在2026年以意想不到的方式重塑整个消费电子格局 半导体的故事不再是一条单线,而是一张持续自我重构的网。而 2025 年,大概只是合纵连横的第一回合
fin tweet mediafin tweet mediafin tweet media
fin@fi56622380

芯片只有AI火热,半导体的2024年基本延续了2023这个基调 只要蹭上AI相关的叙事,股价增长表现都是接近翻倍或者更高,毕竟这是确定性的增长机会,PE都会给的很有想象力 蹭AI失败典型就是高通,微软的recall功能跳票,导致AIPC/端侧LLM叙事直接破产,股价高点下跌不少,就算赢了跟ARM的官司也无济于事 微软跳票+苹果apple intelligence乏力+安卓碎片化,今年端侧AI/LLM只能这么评价:存在感基本为零 端侧LLM功能开发是heavy lifting,即便端侧算力完全达标了(手机端NPU算力去年已经75TOPs了,非常暴力,标准的桌面级,两年内到150Tops问题不大),端侧LLM生态也还没有那么快,还需要SDE们的持续爆肝。我还是和一年前观点类似,看好26~27年才会有比较显著的进展和丰富一些的玩法 端侧AI目前唯一的热点就是智能眼镜,Meta的Rayban眼镜只是个原型,AI功能实用性基本可以忽略,也卖了两百万,整个智能眼镜市场全年接近四百万销量,风头超出了所有人的预期,PMF得到了验证 虽然目前的智能AI眼镜跟LLM半点关系都没有。24~25年主要的端侧AI部分就是眼球追踪和手势追踪,顶多加上OCR,毕竟眼镜只有那么一点点算力,功耗要求也过于严格(<1w)比手机低了一个数量级 下周的CES在端侧AI基本上就是AI眼镜主题秀,说百镜大战可能有点夸张,但差不多就是这个热度,是典型的Hype没错,但未来可期也是真的 -------------------------------------------- 另一个蹭AI失败的Micron,则是因为PC和手机端的DRAM需求比预期疲软,股价涨了一阵跌回原地。毕竟PC和手机端内存是大头,HBM的占比暂时还是太低了,难以撑起AI叙事,7倍的forward PE低的令人发指 AMD是个例外,蹭上了AI竟然还是跌的,2025的PE也低到竟然只有17。各家CSP都热衷于自研model->compiler->asic accelerator从上到下一整套解决方案提高performance,ASIC赛道的火热,让AMD和Nvidia在同一个赛道火拼,只能说CUDA积累的生态优势恐怖如斯 ------------------------------ 蹭AI姿势最成功的,莫过于给各家互联网云厂CSP们做ASIC AI加速器的Broadcom和Marvell,都是直接靠画饼就能翻倍,太可怕了(以及即将蹭上的MTK/AICHIP) 这大概是2024年最大的的芯片风口转型故事 其实帮互联网公司做ASIC AI加速器对于传统半导体厂商并不是特别有挑战性的事情,对IP的要求并不高,主要是做SoC的infra从前端到后端整个配套设施,核心core ML加速器+上层compiler都是互联网公司自己做。 只要服务态度好,客户支持到位,要求什么就给什么,价格合理,门槛并不是那么高。除了互联interconnect IP,基本上可替代性比较高 所以MTK这种云端NPU经验并不多的芯片厂,也能当Google TPU V7之一的供应商 大公司deploy自己的model时,现在都喜欢用自己的asic配套自己的compiler,自己做的asic明明在纸面功耗比上(TOPs per watt)比H100差了不少,甚至能到40%,要花大力气用自家的功耗比并不是那么好的asic,表面上来看并不合算,除了控制成本(和NV讨价还价),为什么还要自己做? 简单的说,各种深度学习model/workload的瓶颈都不一样,很难有通用的解法,卖家标称的纸面性能/功耗比,并不能代表实际日常的实际表现 公司即便是把H100拿过来用,不经调试直接跑自己的model,其实根本跑不到Nvidia标称的性能performance,差距非常明显 如果要跑出理想的performance,要去研究model怎么适配CUDA做优化,甚至需要改compiler里面的一些参数,所以即便是Nvidia,也会派人给大客户针对他们的workload去optimize/tune CUDA/compiler层 而如果大公司比如meta用自家的model/compiler和hw全套,特定的workload会比其他家的ASIC比如高通的AI100 性能要高数倍 因为自家的模型运算细节自己都了解,可以针对自己的model改compiler和芯片,model的size等各种参数达到最好的效果,从内存分配逻辑,kernel tuning,数据精度,tiling,流水线pipeline结构去从硬件的角度迎合上层model的优化,性能差距会非常大,这是一个上层应用决定硬件形状的时代 如果meta用高通的SDK+compiler+ASIC全套,没有办法针对自己的model去优化,只能用高通的东西去sweep各种参数,这里说的sweep意思是高通的SDK和编译器允许用户调整一些参数(例如线程块大小、内存分配策略、流水线深度等)来优化特定operator的性能。用户会尝试不同参数组合,以找到性能的sweet spot 而sweep参数获得的性能优化会比较有限 这就是为什么最后大公司比如meta的model运行在高通的asic上面的performance,反而会不如自己家看起来功耗比更差的全套compiler+ASIC ----------- 为啥CSP们要自己做芯片的同时又外包给传统半导体厂商呢? 一块SoC里大部分IP,包括Cache/memory,CPU,DSP,high speed IO, boot以及低功耗控制,需要的人力是很多的,但只是提供了一个承载ML加速器运行的infra平台,对于互联网厂家来说没有任何自己做的必要,CSP们只会对直接影响ML加速器部分的内容感兴趣 芯片这个圈子太小了,而且前端后端各个角色之间隔行如隔山,挖人不容易,无法在短时间内招到一个磨合良好的团队稳定的迭代项目。Goole/Amazon/Microsoft/Meta这几家开出高出市场价很多的薪水四处挖角,silicon team也都只是几百人到一千人的规模。一般来说从零开始组建一个不错的大厂silicon design house成型,起码要十年时间 所以给成熟的芯片大厂外包做是一个很合理的选择 ------------- 那么CSP们会不会自己做了ASIC然后往外卖和Nvidia竞争呢? 不会,因为这些ASIC组成立的目标KPI就是节约了多少成本,专门做这个生意风险和投入不成正比,芯片支持多个客户的成本是上升很多的,完全没有必要 这也是为什么这些ASIC组在制定架构指标时比较省心,直接对标Nvidia下一代的Tops以及带宽指标就行,同算力功耗多了50%也无所谓,靠后期compiler和针对性架构来弥补,反正只要能节省成本不被Nvidia压榨就行 ----------------------------- ASIC AI加速器故事即便在2025~2026年,其实也还是整个市场占比很小的小众市场,Nvidia仍然是这场LLM科技革命里毫无疑问的基建期唯一大boss 至于openAI/Anthropic能不能像2004年的Google/Facebook一样,成长为这一轮浪潮里的新巨头,那就拭目以待了 2025年的半导体,AI作为主旋律的日子,怕是还会持续。不过其他领域的复苏,比如汽车电子的增长,还是比2024要好看些的 2025除了AI主旋律外最大的看点,就是intel的18A制程量产效果能否如期落地,这可能是2025影响产业格局最大的事件了

中文
85
370
1.2K
836.2K
QiuShao
QiuShao@qiushao87·
@LinQingV 索尔斯吧 mocvd全球就20几台,索尔斯锁了大头 生长炉切片机不缺,半年就安装调试了
中文
1
0
1
297
Macro_Lin | 市场观察员
补一条InP的产业链地图。 最上游是高纯铟。全球七成铟资源在中国,2025年2月对铟加了出口管制,国际铟价应声上涨。国内铟的供应主要看锡业股份和株冶集团,一个全球铟产量第一,一个是国内第二梯队。 铟往下走一步是InP多晶料合成。高纯铟和磷在高压炉里反应,生成多晶锭。这个环节国内扩产最猛,陕西铟杰规划250吨产能,2026年底落地。全球多晶料正在经历一轮集中扩产,2027年总产能有望突破640吨。 多晶料再往下是单晶生长和衬底切片,整条链最卡的环节。海外是住友和AXT(北京通美),国内看云南锗业,子公司鑫耀半导体是目前国内最大的InP衬底供应商,4英寸已批量出货,6英寸在爬坡。有研新材承担了02专项的6英寸攻关项目。广东平睿晶芯投了11亿建产业园,规划年产30万片。 衬底片交给外延厂,用MOCVD在上面生长几十层纳米级量子阱结构,做成外延片。这一层海外被Coherent、Lumentum、三菱电机把持。国内三安光电武汉基地月产1万片6英寸,已经进了华为供应链。九峰山实验室在6英寸外延工艺上做到了国际领先指标,下一步目标是8英寸。 外延片往下是光芯片。DFB激光器、EML、CW光源、探测器,都在这一层。国内的源杰科技在100G EML上做到了国内份额最大,光迅科技覆盖从芯片到模块的垂直链条,长光华芯做高功率激光。 最下游是光模块,中际旭创和新易盛。这一层大家最熟,关注度最高,业绩兑现也最快。但它们的出货节奏,最终受制于上面每一层的产能释放。 整条链的特征很明显。越往下游,玩家越多,产能弹性越大。越往上游,玩家越少,扩产越慢。光模块厂的订单再多,上面衬底和外延跟不上,也只能等。
Macro_Lin | 市场观察员@LinQingV

AXT昨天定价了一笔5.5亿美元的增发,今天完成交割。募资用途很明确,扩InP衬底产能。 一家年收入8800万美元、还在亏钱的公司,一次增发募了超过年收入6倍的钱。市场在为一件事付溢价。它赌AI光互联的上游材料会长期紧缺。 磷化铟衬底是光模块产业链里存在感最低的环节,也是供给弹性最小的环节。光模块的故事讲了两年,800G放量、1.6T送样、头部公司业绩翻倍,注意力一直在下游。产业链里谁的产能最难扩,谁就卡着整条链的节奏。 InP是做光芯片的基础材料。激光器、探测器、调制器,底层都长在InP衬底上面。1310nm和1550nm波段的高速光发射,硅做不了,只有InP行。你走EML方案也好,走硅光加外部光源也好,物理起点都是一片InP晶圆。 很多人以为硅光是替代InP的。反过来。硅光方案里硅负责波导和调制,发光还是得交给InP。每个硅光引擎配一颗InP的CW激光器。英伟达Quantum-X一台交换机装18个硅光引擎,18颗InP光源。硅光越火,InP用量越大。 四家公司控制全球95%以上的InP衬底产能。住友电工大约六成,AXT通过北京通美大约三成半,加上JX金属和少量其他厂商。半导体材料里很难找到比这更寡头的格局。 缺口的数字很直白。2025年全球InP器件需求大约200万片,产能60万片左右,差了七成。头部订单排到2026年。住友说2027年前扩产40%,AXT说翻倍,JX说扩20%。听起来力度不小。但需求那边是指数型增长。一个800G模块用4到8颗InP激光器芯片,到1.6T每个光引擎对衬底面积需求是800G的四倍。供应商涨两三成,需求可能已经翻了一倍。 扩产又快不起来。InP单晶生长靠VGF或VB法,设备定制化程度高,良率爬坡按年算。跟硅晶圆那套成熟体系完全不是一个速度。2英寸衬底价格从8000元涨到1.67万,涨幅超100%,照样供不应求。 所以AXT这笔5.5亿美元增发的逻辑就很清楚了。去年12月刚融了1亿,四个月后又融5.5亿,募资规模翻了5倍还多。它在抢时间窗口。趁股价在高位把钱拿到手,砸进北京通美的产线。这个窗口关不关得上,取决于扩产速度能不能追上需求曲线。目前看,追不上。

中文
34
91
343
105K
fin
fin@fi56622380·
AI半导体终局推演2026(II) 目前的topic 为什么HBM在结构上很可能会摆脱传统周期性,进入成长周期性?HBM的升级节奏会如何发展? (tiktok节奏,size和speed交替换代升级) 这会给HBM的供应和需求市场带来什么样子的capex成本结构变化?Capex内战里为什么HBM会持续占优势? 为什么Nvidia未来最大的竞争对手不是AMD,是Samsung,Hynix,Micron? AI推理时代,这个依赖HBM指数增长的GPU架构路线进化路线,会不会停止?什么时候停止? 那么以后DDR和NAND呢?有没有摆脱周期性的可能? AI Semiconductor Endgame Scenario Analysis 2026 (II) Current Topics Why is HBM structurally likely to break away from traditional cyclicality and enter a growth-cycle paradigm? How will the upgrade cadence of HBM evolve? (A “TikTok-style” rhythm: alternating generational upgrades in capacity/size and speed.) What kind of changes will this bring to the capex cost structure in the HBM supply and demand markets? In the internal “capex wars,” why will HBM continue to dominate? Why will NVIDIA’s biggest competitors in the future not be AMD, but rather Samsung Electronics, SK hynix, and Micron Technology? In the era of AI inference, will the GPU architectural path—highly dependent on exponential growth in HBM—eventually come to a halt? If so, when? What about DDR and NAND going forward? Do they have any possibility of breaking free from traditional cyclicality?
中文
8
6
47
21.7K
fin
fin@fi56622380·
AI半导体终局推演2026(I) 当新token经济学范式从GPU算力转移到HBM 本文从从GPU架构进化路线本质出发,解释这个市场长久以来担心的问题: 每个GPU的HBM内存需求为什么一定会是指数增长,为什么HBM需求指数增长不会停滞? 并推导token经济学在当前架构下第一性原理:token吞吐 = HBM size X HBM BW带宽 同时讨论了,为什么GPU的天花板被HBM的两个发展维度所决定 HBM周期性这个话题争议一直很大,乐观派认为AI带来的需求比以前要大的多,但市场主流仍然认为前几次上升周期也有需求每年20%+增长,这次又有什么不一样呢?AI不影响HBM和传统DRAM一样有commodity属性,一旦在需求顶峰扩产遇上需求下行又会重蹈覆辙。 我们可以从算力芯片架构视角,从第一性原理出发,来拆解和推演一下这个问题:为什么这次真的不一样 ------------------------------- 历史:CPU算力时代 很久以来,我们都处在CPU主导算力的时代,CPU的最高级KPI就是performance,跑的更快,所以每一代的CPU都用各种方法来提高跑分,最开始是频率上升,后来是架构演进superscaler等等 这个时候为什么DDR不需要很快的技术进步速度?比如DDR3到DDR5竟然经历了15年之久 因为这个时期的DDR的角色是纯粹的辅助,而且辅助功能极弱,以业界经验,DDR的速度即便是提高一倍,CPU的performance一般只能提高不到20%这个量级 为什么DDR带宽速度提高了用处不大?两个原因 1. CPU设计了各种架构去隐藏 DDR延迟,比如superscaler,加大发射宽度,用海量的ROB和register renaming来提高并行度隐藏延迟,一级缓存cache,二级缓存cache,削弱了DDR的带宽速度需求 2. CPU workload对DDR带宽要求并不高,大部分日常负载比如打开网页,DDR带宽是严重过剩的,甚至云端负载 也就是说,在CPU时代,DDR的带宽速度是不太有所谓的,DDR4和DDR5除了少数游戏就没啥差别,甚至JEDEC标准也进步缓慢。 另外,绝大部分app需要一直停留在DDR上的部分并不多,需要的时候从硬盘上调度到DDR即可,app的size增长没那么快,导致对DDR的容量需求也较为缓慢。 所以最近十年来,平均每台电脑上的DDR容量大概从7~8GB变成了23GB,十年只增长了3倍。 而这部分升级缓慢直接影响了营收,size容量计价是赚钱的主要方式,速度的提高只是技术升级,提高size的单价,这两个的升级需求都不大,需求主要是随着电脑/手机数量增长而增长 所以DRAM在带宽速度和容量这两个维度上,一直是都是芯片产业锦上添花性质的附属品,DDR升级带来的边际效用是很低的,跟CPU时代的最高KPI几乎没什么直接联系 -------------------------------------------- 而到了genAI 大模型为主导的新时代,计算范式转移让最高级KPI起了根本变化 GPU发展到AI推理的时代,不再像CPU那样只看跑分,最高级的KPI不再是算力TOPS/FLOPS,而是token的成本,特别是单位成本/单位电力下的overall token throuput 其次是token吞吐速度,因为在agent时代,很多任务变成了串行,token吞吐速度成了用户体验的重要瓶颈。 这也是为什么老黄发明AI工厂概念的原因:最低成本的输出最多token,同时尽量提高token吞吐速度 AI训练时代,老黄的经济学是TCO(total cost ownership),买的GPU越多,省的越多 而老黄在推理时代的token经济学是: AI推理的毛利润很可观,所以逻辑已经转换成:Nvidia GPU是这个世界上让token单价最便宜的GPU,买的GPU越多,赚的越多 最高的KPI变成了Pareto frontier曲线,在提高token 吞吐throughput和提高token速度两个维度上尽量优化 (见图一) NVIDIA 的 token factory 代际进步,其实是在把整条 Pareto frontier 往右上推,这就是是AI推理这个时代最重要的KPI ---------------------------------- 接下来是本文最重要的逻辑链,如何从token吞吐量指数型增长的本质出发,推导出天花板瓶颈在HBM size和HBM 带宽的指数型增长 单卡GPU推理单线程batch size = 1的时代,token吞吐只有一个维度,就是HBM的带宽速度,带宽速度越高,token吞吐越大 但进入NVL72的年代,推理不再是单卡GPU时代,而是72个GPU + 36个CPU整个系统级别的token工厂,把HBM带宽和算力用满,获得极致的token吞吐量 Token 吞吐throughput的增长,依赖两个东西:同时批处理的请求数 X 每个user请求的平均token速度 也就是batch size X per user token 速度 以Rubin NVL72为例,在平均token速度是100 token/s的情况下,同时批处理1920个请求,得到token吞吐量是19.2万token/s 一个Rubin NVL72大概是120KW(0.12MW)的功率,所以得到单位MW能处理1.6M token/s (见图一) 所以,我们需要想方设法提高这两个参数:批处理数量batch size和per user token的平均速度,这两者相乘就是我们的最高KPI,也就是token的吞吐量 ------- 第一个参数:batch size的增长,瓶颈在HBM size 批处理量里的每一个请求req,都会自带kv cache,这部分kv cache是需要存在HBM里的,大小大概在几个GB到数十GB不等 因为hot kv cache是随时需要高频高速读取,所以必须放在HBM里,比如一个大模型的层数是80层,那么每一个token的生成阶段,都需要读取80次HBM里的kv cache 随着批处理数量batch size的增长,会带来hot kv cache的线性增长 又因为这个批处理量的所有请求的hot kv cache,都要放在HBM上,这也就带来了HBM size必须要随着批处理量batch size线性增长 就像是机场接驳车,登机口尽量快的接旅客到飞机,HBM size小了,相当于接驳车size小了,就得多接一趟 结论是:批处理量的数量batch size,瓶颈依赖于HBM size的增长 --------- 第二个参数:每个user请求的平均token速度,瓶颈在HBM带宽 大模型decode阶段的速度,瓶颈取决于HBM的带宽速度,因为每生成一个 token,都要把激活的权重和kv cache 读很多遍 LPU的出现,在batch不那么大的情况下,把激活权重这个部分搬到了SRAM上,但是每生成一个 token仍然要从HBM读很多次KV cache。HBM带宽越高,生成每一个token的速度也就越快,基本上是线性对应的 就像是机场接驳车,登机口尽量快的接旅客到飞机,hbm本身带宽速度就像是接驳车的车门有多宽,门越宽,旅客上接驳车越快 GPU的其他配置,都是在适配batch的增长以及要让token compute的速度配平HBM的增长,甚至会用多余的算力来获得部分的带宽(比如部分带宽压缩技术) —----- 在那个接驳车的比喻例子里 接驳车的车厢大小 = HBM Size(容量): 决定了一次能装下多少名旅客(也就是能同时装下多少个请求的 KV Cache)。车厢越大,一次能拉载的旅客(Batch Size)就越多。如果车太小,想拉100个人就得分两趟,系统整体的吞吐量就上不去。 接驳车的车门宽度 = HBM Bandwidth(带宽): 决定了旅客上下车的速度。门越宽,大家呼啦啦一下全上去了(Decode/生成Token的速度极快)。如果门很窄,哪怕车厢巨大能装200人,大家也得排着队一个一个挤上去,全耗在上下车的时间里了。 旅客的吞吐量 = 接驳车车厢容量 x 接驳车旅客上车速度(车门宽度) —--------------------------- 至此,我们从逻辑上推演出了token经济学的硬件需求第一性原理: Token throughput = HBM size X HBM Bandwidth AI推理这个时代的最高KPI,实际上是高度依赖于HBM的两个维度的进步的 如果要维持token throuput每一代两倍的增长,实际上意味着,每一代的单GPU上,HBM size X HBM BW带宽之积要增长两倍! 这也是历史上第一次,HBM内存的size可以影响最高的KPI token throughput! 要验证这个理论,可以把Nvidia从A100到Rubin Ultra这几代的token 吞吐throughput,和HBM size X HBM BW 放在同一个图里比较 (见图二) 可以发现,这两个曲线的走势在对数轴上惊人的一致 HBM size x HBM带宽增长的甚至要比token吞吐量更快,毕竟HBM决定的是天花板,实际上这个天花板增长的利用率utilization是很难达到100%的,也就是说,HBM size x HBM 带宽就算增长1000倍,其他算力和架构的配合下,很难把这1000倍的天花板潜力全部榨干 这条曲线不是巧合,而是系统最优化的必然解 throughput = batch × Bandwidth,这就是token factory 经济学最绕不开的第一性原理 —-------- 软件的影响呢?软件的优化会不会降低带宽的需求?降低HBM的需求? 这跟硬件是独立两个维度的,这好像在问,如果CPU上的软件优化了之后跑的更快,是不是CPU就十年不用发展了?反正软件跑的更快了嘛 这样的话,CPU厂还能赚得到钱吗?CPU想要存活下去,只有一条路可走,在标准benchmark,不考虑软件优化,每一代CPU必须要跑分更高,不然就卖不出去 GPU也是一样,软件优化如何,和自己的token吞吐量KPI每年都要大幅进步,是两回事 只要token的需求继续增长,对token throuput的追求就绝不会停止,那么对HBM size X HBM 带宽的追求也不会停止 如果HBM size和HBM 带宽发展慢了,老黄一定会亲自到御三家逼着他们技术升级,因为这就是老黄gpu的天花板,天花板要是钉死了不进步,老黄的GPU还能卖出去吗? 当然了,Nvidia需要绞尽脑汁去从异构计算的架构角度榨取HBM天花板之外的部分,比如LPU就是一个很好的尝试,把Pareto frontier从另一个角度改善了很多 (右半边高token速度的部分) —-------------------------------------- HBM内存已然告别了那个随波逐流的旧时代,在这条由指数级需求铺就的单行道上,以一种近乎宿命的方式走到了产业史诗的主舞台中央 推理范式第一性原理演化到这一步,只要老黄还要卖GPU,HBM就必须翻倍,而且必须代代翻倍。这是supply side的内生压力,与AI需求无关,与宏观周期无关,与hyperscaler的心情也无关 剩下的问题,只有一个: 当需求被物理锁定为指数增长的时候,供给侧的三个玩家,会不会还像过去三十年那样,亲手把自己再拖回一次周期的泥潭?
fin tweet mediafin tweet media
fin@fi56622380

回顾2025年半导体市场,真的是有太多太多精彩的故事,最大的主题就是: AI需求驱动导致半导体基建的估值体系重构 + 产业链的价值分配重写 从2024年开始,半导体基建正在飞速吞噬整个IT产业利润,SP500里半导体净利润EPS在IT行业里占比,在两年时间从不到20%上升了到了40%,而且还在呈加速上升姿态 半导体整体前瞻利润率从2023年的25%已经升到了2025年11月的43%,已经明显超过了几个互联网巨头的平均利润率,这也印证了半导体利润率超过互联网会是新常态。整个IT产业的利润分配,流向半导体的比例越来越大。 要知道,就算是20~22年的半导体芯片荒,短缺如此严重,半导体的利润率和整个IT利润分配也没有显著增长 这就是故事的上半篇:AI需求驱动导致半导体基建的估值体系重构,不再是互联网时期的基建从属地位 ------------------------ 这个现象背后的逻辑是商业模式随着技术特性的变迁: 互联网时代,每次请求的网络和算力成本,边际成本极低,scaling的效果极好,分发的边际成本几乎为零 在AI时代,这个互联网时代分发边际成本几乎为零利于scalable的特性遭遇了根本性的重大挑战:且不说训练成本从此不是一次性开销而是年年增长,就客户的AI推理请求而言,由于inference scaling成为共识,加上垂直领域仍然需要更大规模的旗舰模型来保持竞争力,推理的成本不会随着硬件算力价格的通缩而同步降低 互联网企业从前的最大成本只有OPEX尤其是SDE人工成本,而现在,互联网公司历史上第一次像半导体厂foundry那样背上高折旧成本的资产负债表,商业模型恨不得要慢慢从“流量 × 转化率”部分转向“每 token 毛利”了 简单的说,互联网时代到AI时代的成本分布,在人力成本opex的基础上又加上了沉重的硬件/算力成本capex(财报里占比:MSFT 33%, Meta 38%)。 上个时代的互联网公司+CSP+SAAS是收租行业里的大赢家,而AI时代,算力(半导体/芯片折旧)成为了新的收租行业,整个IT行业的利润分布发生了剧烈的重新分配(EPS利润流向半导体从20%升到40%而且持续攀升中),这就是半导体基建估值体系重构最重要的原因 --------------- 半导体高利润率的新常态趋势能持续多久? 目前的高溢价来自于前期不计成本的军备竞赛造成的半导体订单积压过多 但很显然,hyperscalers都不愿意当冤大头,都在试图自建ASIC降低成本,那么可以从2030年远期的算力分布来回看这个问题 长线来看,openai已经明牌了标准答案,10GW Nvidia,10GW ASIC,6GW AMD,其他hyperscaler划分比例有类似考虑 比如说,推理端希望ASIC >50%,GPU里再细分的话,AMD和NV(legacy)对半分。训练还是得NV占大头,60%+,剩下的自研ASIC和AMD对半分 2030年按60%推理,40%训练比例划分,算下来NV 38%, ASIC 39%, AMD 23%,跟openAI比例是几乎完全一致的,算是一个标准答案参考值 当然了,微软,Amazon,Google,Anthropic这几家里AMD的比例会比这个标准答案中枢/参考值明显低一些,xAI则是没有ASIC只有Nvidia+少量AMD AMD的风险在于,当2030年再往后的更长期,CSP的in house ASIC越来越成熟(微软除外),推理端ASIC占比可能越来越高,很难有incentive新买入大量GPU了,除非卖的足够便宜 最近风头正劲的TPU呢?Meta是不是要转向TPU?对Nvidia的利润率影响大吗? 实际上,Meta今年capex72B,明年capex110B,未来六年capex平均值可能达到160B附近,而Meta 6年10B的TPU订单算下来年均只有1.6B,而且购买的是TPU云服务,并不是裸TPU 也就是说,Meta这笔TPU订单只占到Meta未来6年capex的1%,并没有严肃的考虑大规模部署,可能只是作为和Nvidia讨价还价的手段而已 另外从Meta最近几个月的招聘广告来看,也并没有看到任何TPU engineer方面的招聘,不像 Anthropic那样从五月就招一堆TPU kernel engineer,十月才宣布大规模采购TPU做训练 所以说,不管原因是diversify供货商,还是给自研ASIC延迟做退路,还是因为AMD的MI350X延迟,Meta买TPU基本上只有一个考虑:增加买Nvidia GPU的议价权,但顶多只有推理份额里能讨价还价,实际效果很有限,对Nvidia利润率影响也很有限。 要知道,22年加密货币熊市矿难的时候,NVDA库存上升到了198天,利润率只是从65%回撤到了56%,算上PE/宏观双杀股价才从300变100,现在一直供不应求,利润率没道理能降下来 再加上TPU v8设计过于保守(没用HBM4),Kyber rack的Rubin方案会比TPU v8的TCO更好,到头来最后还是得继续依赖Nvidia,很难议价。只要Nvidia继续保持这样的大踏步前进,竞争对手其实要跟上还是不容易的。 总之,一方面,全产业链瓶颈,比如cowos扩张都很谨慎,供不应求的状态还能持续多年。 另一方面,AI变现的利润曲线和硬件投入曲线存在“时间错配”,应用端的增长曲线会落后几年,只要这个应用端和基建端的增长曲线的时间错位依旧存在,半导体在IT行业的利润分配就会一直占优势。 从OpenAI的到2030年的投入曲线来看,这个时间错位至少要持续到2030年附近。也就是说半导体行业的超级扩张期带来的在IT产业利润划分的主导地位,目前看至少能持续到2030年 而半导体高利润率可能会维持的更长远一些,因为从互联网时代一次性基建属性变成了现在的收租基建属性 --------------------------------------------------- AI 不是只养活了 GPU,而是在用算力预算把“能把电变成 token 的每一环”都抬了一轮,从内存,存储,互联,光纤,电力,储能…..等等 上半篇讲完了“半导体吞噬IT利润”,那么下半篇讲的就是“AI算力价值溢出效应(Spillover Effect)重塑半导体内部格局”:GPU算力增长 -> 内存/存储/互联/CPU瓶颈 -> 溢出效应 -> 结构性机会 2025 年更有趣的故事,是巨大的行业红利在半导体内部怎么诞生结构性新机会,比如说,一个super cluster需要几个数据中心互联,光纤互联的长度需要上百万mile这个级别,这就是新机会 半导体产业链的结构性趋势带来的新机会,最典型的例子就是内存(DRAM/HBM)和存储(SSD),HBM的需求增长太夸张,连带挤压DDR4/5产能,直接让以周期性为标志的内存行业甚至喊出了“周期不存在”了,Hynix因为在HBM上领先,甚至都开始憧憬起了几年后年利润1000亿美元,妥妥一个万亿市值的公司 这两个板块背后,是结构性趋势的转变:AI workload从训练逐渐往推理延申,推理比例越来越大。 而推理是一个非常纯粹的吃内存带宽速度(memory bound)的事情,可以说带宽速度=token/s。模型尺寸越来越大,以及上下文context length的增加,对内存的尺寸要求也相应增大,导致了内存的需求激增:推理即内存 下一代的的GPU/ASIC内存已经成了暴力美学,配备的内存size之巨大,是三年前无法想象的,回看22年H100的80GB简直像个玩具,这才几年就增长了十倍: Nvidia Ultra Rubin - 1024GB HBM Qualcomm AI200 - 768GB LPDDR AMD MI400x - 432GB HBM 内存的另外一个潜在的爆发点在端侧,也就是手机/PC/汽车/机器人的端侧LLM,这两年主流的手机旗舰机已经从6GB升级到了8GB/12GB/16GB,提前为可能的端侧LLM生态做准备,毕竟手机算力下一代就能达到150TOPS量级,妥妥的桌面级,非常暴力 潜力上来说,端侧内存升级是比云端内存增量要更大的市场,毕竟端侧终端device的数量太惊人了,每年都是billion级别,一旦端侧LLM生态繁荣起来,内存用量翻倍轻而易举,针对端侧低功耗内存/存算一体的各种设计都会跟上 但端侧genAI的软件生态,似乎明显滞后,一直比我想象的进度要慢,可能是因为这方面还处于摸索期,并没有云端那么确定的ROI,厂商们在投入上都很谨慎,我在23~24年时候看好27年,可能还是太乐观了 互联网->移动互联网用了10~15年,端侧genAI/LLM可能也需要7~10年,可能得等云端ROI开发的差不多了,边际收益下降了,才能轮得到端侧genAI/LLM拿到开发资源,跑通端侧ROI。 -------------------------------------- 另一个2025年半导体内部结构性转变的故事是NAND存储,特别是企业级eSSD硬盘 结构性趋势来源也是同一个,AI workload的推理需求越来越大。内存红利也外溢到了SSD存储,甚至HDD存储,因为内存不够用就用高速SSD作为多级缓存 主要逻辑是AI推理过程中内存溢出KV cache offloading到下一层SSD存储,以及向量数据库检索/indexing,都在增加SSD存储的需求 Micron财报说的精准又直白:“AI inference use cases such as KV cache tiering and vector database search and indexing, are driving demand for performance storage.” 至于为什么存储价格在第四季度才爆发,这需要区分一下合约价格和现货价格,合约价格涨幅会温和一些,就算是最紧缺的企业级eSSD合约Q4上涨大概25%。而当NAND产能在2025年被合约慢慢的吃光,现货的价格就造成了观感上强烈的冲击,一个月上涨50%以上。 另一个未经验证的逻辑是多模态的爆发,特别是AI图片和AI视频的需求爆发,也会加剧存储的短缺,我觉得这条线只能说未来可期,但目前的视频/图片精细程度,可能还不到当年GPT3的水平,要达到出圈效果还需要一些时日。 ------------------------ 那么下一步还有什么趋势转移带来的半导体结构性的机会呢 那么就要先看下一步AI推理端的需求趋势是什么,毫无疑问,agentic flow的比例会越来越大,2025并不是year of agent,而是一个decade of agent 从CPU视角去看agentic workload,routing和工具处理都在CPU上,如果把常用的agentic框架做profiling,比如SWE-Agent, LangChain, Toolformer,CPU最长可以占到90%的E2E端到端延迟,throughput瓶颈也更多的卡在CPU,甚至CPU能耗也超过了总能耗的40% Agentic AI目前是一个CPU瓶颈更多的事情,在 agentic 框架里,CPU 是永远在忙的总指挥orchestrator, 很可能会成就CPU需求的新一波回暖 AMD 2025年Q2财报(8月5日),Lisa Su明确表述了这一现象:​"In particular, adoption of agentic AI is creating additional demand for general-purpose compute infrastructure, as customers quickly realize that each token generated by a GPU triggers multiple CPU-intensive tasks." "agent AI的采用正在对通用计算基础架构产生额外的需求,因为客户很快就意识到GPU产生的每个令牌都会触发多个CPU密集型任务。" ​Q3 财报里Lisa又明牌了一次CPU TAM increasing due to Gen AI. "Many customers are now planning substantially larger CPU build outs over the coming quarters to support increased demands from AI, serving as a powerful new catalyst for our server business." Nvidia也是把agent flow视为CPU需求,GB200/300 架构配置的CPU比例也比以往大的多,36颗 Grace CPU : 72颗 Blackwell GPU,直接达到了1:2的水平,AMD的路线则是用1~4个256核的EPYC去服务MI400系列72~128个GPU 以后的硬件架构,一定会往优化agent workload方向发展,比如agent task graph的调度和load balancing,CPU/GPU协同micro-batching 算力上的比较,说不定以后也会摆脱现在的纯GPU token rate比较,转向整个系统级全栈agentic benchmark比较. -------------------------- 半导体结构性转变带来的机会同时,下一步,可能也会带来一些意想不到的次生效应 云端AI数据中心需求爆发,造成内存和存储的暴涨,给消费电子的成本带来了很大压力,在2026年,这也许会演变成消费电子产业潜在的黑天鹅 PC厂商最近的股票大跌,也是这个原因。HP已经说了要减少内存配置,暗示要把PC重回8GB内存+256GB存储的时代了。 DRAM内存和存储再这么涨下去,可能会出现很离谱的情况:内存/存储现货价格比CPU和GPU还要更贵。尴尬的是,这可能直接延缓了消费电子期望的AI PC的进程,毕竟大内存是更有利AI PC的表现力的。 夸张的说,每个PC厂商和手机厂商的员工,甚至是消费电子厂商的员工,都应该买入存储和内存,作为职业风险对冲 明年年初开始,安卓阵营的内存以及存储成本要压不住了,三星,小米的手机售价都提高的话(美国市场现在已经提高不少了),利好最大的就是苹果 苹果的内存产能,nand产能都是专属长约锁价特供的,顺带还把Kioxia给坑了好多不涨价产能,导致苹果的成本优势进一步扩大,苹果全球手机销量市占率增长可能会非常可观,接下来一阵子可能会是iphone辉煌的时光。 ----------------------- 2025年半导体市场真的是太多精彩的故事了,Nvidia/AMD/TPU和各家hyperscaler的恩怨情仇引得各路下注的吃瓜群众心情跌宕起伏。 HBM/内存厂商吃到了memory-bound的红利,NAND厂商意外收获了KV cache的溢出效应,CPU在沉寂近十年后,可能会因agent orchestration再次回到增长叙事的中心 不再是Nvidia/AVGO几家算力厂商独大,而是AI workload算力价值溢出后的每一次演进,从训练到推理,从文本到多模态,从单模型调用到agentic flow,都在重写产业链的价值分配。 云端AI的繁荣正在挤压消费电子的生存空间——当PC厂商被迫讨论重回8GB时代,苹果却因供应链优势坐收渔利。这场算力军备竞赛的次生效应,可能在2026年以意想不到的方式重塑整个消费电子格局 半导体的故事不再是一条单线,而是一张持续自我重构的网。而 2025 年,大概只是合纵连横的第一回合

中文
62
309
1K
546.4K
Ted
Ted@Riovipvip·
@AntonLaVay 现在依然是买点吗?增速会放慢吗?
中文
0
0
0
38
Ted
Ted@Riovipvip·
@xiaomustock 请教川总:超额税收会减少企业利润,为什么不是大利空呢? 另外川总看过光迅科技吗?
中文
0
0
2
4.3K
Ted
Ted@Riovipvip·
@xiaomustock 川总,对韩高层提出的公民红利构想怎么看?
中文
0
0
1
1.9K
川沐|Trumoo🐮
川沐|Trumoo🐮@xiaomustock·
2026全年这段时间非常值钱, 每一分钱不在AI或者存储上, 都是在巨额亏损, 人类历史上有仅有一次的AI浪潮, 你的人生也有且仅有一次。
中文
29
41
427
206.9K