涟漪us🐞🦋

582 posts

涟漪us🐞🦋

涟漪us🐞🦋

@stone1138

Love #BTC #ETH #SOL #DOGE #BNB

Katılım Ocak 2021
929 Takip Edilen397 Takipçiler
KK.aWSB
KK.aWSB@KKaWSB·
维特根斯坦写完《逻辑哲学论》,觉得自己已经解决了所有哲学问题。 他把书寄给出版社,然后去奥地利乡下当小学老师了。 哲学?解决完了。不需要我了。 他教了六年小学。教得很认真,也很暴躁。他对笨学生没有耐心,有一次把一个女孩打到昏过去。 后来他被辞退了。 他去当园丁,去当建筑师,给姐姐设计了一栋房子。每扇门、每个把手、每个窗户的比例他都要亲自定,工人们被他逼疯了。 然后有一天,他忽然意识到自己之前写的那本书可能是错的。 他回到了剑桥。 重新做哲学。 这次他把自己之前的理论全部推翻了。他花了二十年写了第二本书《哲学研究》,核心意思是——我之前写的那本书的方法论就是错的。 一个人用后半生否定前半生。 有学生问他:"老师,您前半生和后半生的哲学完全相反,我们到底该信哪个?" 维特根斯坦说:"都别信。" 学生说:"那您写这些干嘛?" 维特根斯坦说:"我写的不是答案,是两种犯错的方式。你看完之后知道这两条路都是死胡同,就不用自己再走一遍了。" 学生说:"那正确的路在哪?" 维特根斯坦说:"如果我知道,我就不需要写两本书了。" 他死前烧掉了大量手稿。留下的笔记里有一句话:"哲学的目的不是解决问题,是让你看清楚问题长什么样。看清楚之后你会发现,大部分问题不需要解决,因为它们根本不是问题,是语言在骗你。"
中文
94
127
1K
128.1K
涟漪us🐞🦋
涟漪us🐞🦋@stone1138·
@KKaWSB 是不是把投资的股票作为一种哲学语言,这个股票代表着个人的逻辑和价值观?
中文
0
0
0
507
涟漪us🐞🦋 retweetledi
WquGuru🦀
WquGuru🦀@wquguru·
这两本书把Claude Code和Codex的Harness工程吃透了,对于Claude Code和Codex源码解析和对比都入木三分,文科生也能读的津津有味: 《Harness Engineering——Claude Code 设计指南》:不是源码注释汇编,也不是产品功能介绍。它关注的是 Claude Code 如何把不稳定模 型收束进可持续运行的工程秩序,让控制面、主循环、工具权限、上下文治理、恢复路 径、多代理验证与团队制度长成一套完整骨架 《Claude Code 和 Codex 的 Harness 设计哲学——殊途同归,还是各表一枝》:比较两套 AI coding harness,最容易犯的错误,是拿一张功能对照表当作思想史。左边写“有技能”,右边也写“有技能”;左边写“有沙箱”,右边也写“有沙箱”;左边写“能开子代理”,右边也写“能开子代理”。这样写的好处是省事,坏处是几乎什么也没说。因为工具中的名词相同,不代表系统的骨架相同。就像两个城市都修了桥,不能说明它们是按同一条河设计的。 Github仓库:github.com/wquguru/harnes… 在线阅读:harness-books.agentway.dev/index.html
WquGuru🦀 tweet mediaWquGuru🦀 tweet media
中文
31
494
2K
429.5K
涟漪us🐞🦋 retweetledi
大宇
大宇@BTCdayu·
简直想要嚎啕大哭,这或许就是顶级物理学家的智慧吧,阅读下来甚至就像自己和宇宙产生了某些微妙的连接——对投资或任何领域都有帮助。 以下我收集的关于杨振宁先手的一些最极简的观点: 一、关于直觉 直觉是创造的源泉 直觉 = 长期积累的经验 + 对自然美的感悟 + 独特的个人风格 直觉不是凭空而来的,它是长期苦思冥想的结果。当你在一个问题上卡住很久,突然间,所有的碎片都拼凑在了一起,这种瞬间的明朗就是直觉。 好的直觉,是建立在深刻理解基础上的快速判断 一个好的理论工作者,需要有很强的物理直觉。 学习物理,不只是学计算,更重要的是培养对物理现象的感觉。 直觉与书本知识冲突是最好的学习机会,必须抓住这个机会。 当你发现一件事情违背你的直觉时,要重视,那里可能隐藏着重大发现。 真正的理解,是看见形式背后的结构 好的直觉,是对结构的敏感 数学可以算对,物理直觉却能告诉你方向。 在科学前沿,你并没有地图。你的直觉告诉你,往这个方向走,风景会越来越开阔;往那个方向走,逻辑会越来越臃肿。这种‘方向感’就是直觉。 每一个科学家的直觉都有其独特的‘Style’(风格)。这种风格决定了他对哪些信息敏感,对哪些矛盾不可容忍。 在每一个有创造性活动的领域里。一个人的taste,加上他的能力、脾气和机遇,决定了他的风格,而这种风格反过来又决定他的贡献。 科学研究中,直觉不仅是找出问题的答案,更重要的是决定哪些问题是值得研究的。这背后是一种审美的判断。 直觉是长期对一个领域的专注、思考,使得你在信息不完全的情况下,能够一眼看到事物最本质的结构。 物理学的规律往往具有一种极度的美感和简洁性。一个科学家的直觉,往往就是他感受这种‘大美’的能力。 狄拉克的文章是‘秋水文章不染尘’。他的直觉有一种‘原始的、不可思议的简单’。 每个人在每个时刻都有一些直觉,这些直觉多半是正确的,可是也有一些需要修正,需要加入一些新的观念,变成新的较正确的直觉。我从而了解到:一方面直觉非常重要,可是另一方面又要能及时吸取新的观念修正自己的直觉。 二、其他 自然界具有一种基本的对称性。然而,这种对称性并非绝对。正是这种微小的‘不对称’,构成了我们这个世界的丰富性。 永远不要把“不验自明”的定律视为必然 物理学的规律,其最终的形式往往是极度的美,极度的简洁 一个正确的理论,其数学结构必须有一种‘必然性’ (Inevitability)。你读到它时,会觉得它只能是这样,不可能是别的样子。 真空不是一无所有,真空是充满活力的(Vacuum is dynamic)。它是一个处于最低能量态,却随时准备激发的状态。 科学研究最重要的是Sense of orientation’(方向感/势)。如果你有了这种感觉,你就能在黑暗中摸索到通往真理的门。 直觉和灵感,其实就是‘长期积累的知识在瞬间的逻辑压缩’。当你的大脑已经处理了足够多的模式,它就不再需要推演,而是直接给出了结果。 每一个科学家的直觉都有其独特的‘Style’(风格)。这种风格决定了他对哪些信息敏感,对哪些矛盾不可容忍。 在每一个有创造性活动的领域里。一个人的taste,加上他的能力、脾气和机遇,决定了他的风格,而这种风格反过来又决定他的贡献。 科学里终极的美是客观的,没有人类的时候就已经有这些美了。 本文也收录在了dayu.xyz 随时方便回读。
大宇 tweet media
中文
14
68
232
23K
涟漪us🐞🦋 retweetledi
墓碑科技
墓碑科技@mubeitech·
每天准点起床吃蓝莓、做俯卧撑? 别逗了。 顶级掠食者从不看日程表。 你该像一头狮子那样活着。 百分之九十的时间用来闲逛和睡觉。 随心所欲,无所事事。 把电量全部存起来。 直到那个真正值得你痴迷的目标出现。 然后? 倾尽所有,一击致命。 太多人把自己塞进机械化的齿轮里。 为了表演自律而自律。 这种枯燥的日常重复根本不叫努力。 纯粹是自我磨损。 撕掉日程表。 不要在特定时间出现在特定地点。 不用听命于任何人。 真正的自由,是把极度的慵懒留给日常,把极度的凶猛留给猎物。
中文
17
230
998
73.8K
涟漪us🐞🦋 retweetledi
OdailyNews
OdailyNews@OdailyChina·
OpenAI @OpenAI 替代 Anthropic @AnthropicAI 成为美国🇺🇸“战争部”的首席 AI 供应商“ 这奥特曼假装伸援实则站在道德制高点拿下这份合同,来这一出堪比甄嬛传🥲🥲 今日早前Anthropic 拒绝了五角大楼开放安全限制的要求,特朗普 @realDonaldTrump 强硬下令对其封禁。 这场AI 历史上的“奥本海默时刻”的起因⬇️ 五角大楼军方要求 Anthropic @AnthropicAI 移除 Claude @claudeai 针对 “自主杀手机器人”和 “大规模监控” 的底层限制。否则就将失去 2 亿美元的合同,同时被贴上供应链风险标签。 可这一要求是让Anthropic放弃其核心灵魂——“宪法 AI”,所以这Anthropic也是硬骨头正面硬刚,其创始人Dario Amodei @DarioAmodei 回应“无法从良心上答应”,在资本市场看来是“商业自杀”,但在开发者圈层却赢得了史无前例的尊重。 最戏剧性的一幕来了⬇️ 原本互不理睬、拒绝握手的对手Openai @OpenAI 的创始人 Altman @sama 竟然在公开场合斥责五角大楼的“勒索行为”,这一举动也为他赢得了Openai员工的心,有超过 500 名 员工签署了(其中包含约 266 名 Google 员工和 65 名 OpenAI 员工)"We Will Not Be Divided" (我们不会分裂)的公开信 这也使得Sam Altman有了谈判的底气,以一个“和谈者”身份向军方提出,提出了一项折中方案:“将 AI 模型部署在高度机密的云网络中,但必须明文规定排除国内监控和全自主武器的使用。” 所以 OpenAI 拿下这份合同就是真的“赢”了吗❓
OdailyNews tweet media
中文
3
2
9
4.4K
涟漪us🐞🦋 retweetledi
Will Yang
Will Yang@Will_Yang_·
换算过程: 1️⃣重量换算:贵金属(白银)交易通常使用金衡盎司,1金衡盎司 = 31.1035克。 2️⃣人民币计价:1盎司白银的人民币价格 = 31.1035克 × 25元/克 = 777.5875元。 3️⃣汇率转换:根据当前汇率(1美元 ≈ 6.91人民币),美元价格 = 777.5875元 ÷ 6.91 ≈ 112.56美元。
中文
0
2
2
705
涟漪us🐞🦋 retweetledi
Gavinly
Gavinly@Fengyi1811·
马斯克的情史确实挺丰富的,但就此断定他为渣男未免稍显武断。
Taiwan 🇹🇼 中文
44
132
752
82.5K
涟漪us🐞🦋
涟漪us🐞🦋@stone1138·
@mubeitech 很喜欢你的文章,“当机器可以比专家更“专家”时,人类的价值到底体现在哪里? 黄仁勋似乎给出了他的答案:人性深处的洞察力和同理心。 这种能力,无法量化,无法编程,也无法被轻易复制。” 言简意赅!赞👍🏻
中文
0
0
0
132
墓碑科技
墓碑科技@mubeitech·
你以为的聪明,很快就要不值钱了。 英伟达的黄仁勋最近有个说法。 他说,传统定义的聪明,比如高技术能力、解决问题的能力,本质上是一种商品。 人工智能首先要替代的,就是这种“商品”。 第一个被冲击的“聪明”行业是什么? 软件编程。 这恰恰是过去几十年被认为是顶尖聪明的职业。 一个时代结束了。 那么,真正稀缺的聪明是什么? 黄仁勋的答案很有意思。 他认为,真正的聪明,是技术敏锐度和人类同理心的结合体。 是一种能“预见未来”的能力。 能洞察那些没有说出口的话,能感知到别人忽略的氛围。 这种“直觉”从何而来? 数据分析、第一性原理、人生经验、智慧、对他人的感知。 是所有这些东西的融合。 拥有这种能力的人,才是真正有价值的。 他们能看到问题冒头之前就把它按下去。 这听起来,不像是常春藤名校里用SAT分数筛选出来的“精英”。 更像是在真实世界里摸爬滚打,历经风浪的企业家或政治家。 他们的决策,往往超越了冷冰冰的数据和模型。 这是否在暗示,由所谓技术官僚和数据专家主导的治理模式,其根基正在被动摇? 当机器可以比专家更“专家”时,人类的价值到底体现在哪里? 黄仁勋似乎给出了他的答案:人性深处的洞察力和同理心。 这种能力,无法量化,无法编程,也无法被轻易复制。
中文
39
398
1.5K
204.4K
涟漪us🐞🦋 retweetledi
KK.aWSB
KK.aWSB@KKaWSB·
有人说他不小心在 ChatGPT 里解锁了“上帝模式”, 它开始教出一些我以前从未了解过的东西。 以下这 7 个 ChatGPT 提示将彻底改变你的聊天体验:
中文
33
545
2.4K
573.6K
涟漪us🐞🦋 retweetledi
iPaul
iPaul@iPaulCanada·
诺贝尔奖得主哈耶克的7句逆天预言!
中文
34
768
1.9K
90.2K
涟漪us🐞🦋 retweetledi
Fairice
Fairice@yibingsg·
富豪作家刘震云见识了真正的富豪! 最有钱的巨富都藏在冰山之下,普通人连衣角都摸不着。
中文
149
220
985
247.7K
涟漪us🐞🦋 retweetledi
0x鸣人
0x鸣人@LuBtc888·
花了两个半小时看完了段永平的两个访谈视频,受益颇丰。 刚好现在没啥行情, 有空的都可以看看。 第一个视频是 雪球 创始人 方三文的《方略》访谈节目,全程2小时, 话题主要以段永平的:个人经历、企业文化、企业经营、投资领域、AI、子女教育、愿望,这几个方面展开。 第二个视频是 万科集团创始人 王石 的二任妻子 田朴珺 主持的《共同说》,全程 40 分钟, 话题主要以段永平的:运动观、投资逻辑、企业文化、放权管理、营销心法、未来展望等方面展开。
中文
36
421
1.2K
885.6K
涟漪us🐞🦋 retweetledi
AB Kuai.Dong
AB Kuai.Dong@_FORAB·
盈透证券,宣布将允许散户投资者,使用稳定币为其个人炒股账户注资。 根据披露,这项功能将分阶段推出,首先面向部分美国客户,随后开放更多客户。这意味着投资者,可以直接用稳定币,链上向盈透账户充值,而无需使用银行账户。 在今年,由于查税风波,大量炒美股的某途用户,转移至盈透 IBKR。
AB Kuai.Dong tweet media
Minato-ku, Tokyo 🇯🇵 中文
89
116
668
264.9K
涟漪us🐞🦋 retweetledi
Zhixiong Pan
Zhixiong Pan@nake13·
分享一篇 OpenAI 联合多所世界顶尖大学的研究,这份报告揭示了一个重要趋势: > 前沿大模型正在从单纯的效率工具,进化为具备实质性「智力贡献」能力的科研合作伙伴 。 这份名为《使用 GPT-5 加速科学的早期实验》的报告由 OpenAI 联合牛津大学、剑桥大学、哥伦比亚大学、哈佛大学、加州大学伯克利分校及劳伦斯利弗莫尔国家实验室等机构共同发布 。 报告详细记录了 AI 在生物、物理、数学等领域的实战案例,证明在专家引导下,科学发现的周期在特定任务中正在经历数量级的压缩 。以下是几个标志性的「科研范式转变」时刻。 1️⃣ 生物医学:不仅做分析,更能提出 Novel Mechanism 在针对 T 细胞代谢调控的研究中,GPT-5 Pro 展现了惊人的洞察力。它重新解读了复杂的流式细胞术数据,并提出了一个人类专家未曾设想的机制:2-DG 对 T 细胞的影响并非单纯源于糖酵解抑制,而是通过干扰 N-linked 糖基化驱动 。 基于此假设,它像资深 PI 一样设计了清晰的实验决策树,包括使用甘露糖(Mannose)进行挽救实验 。更令人印象深刻的是,它预测在 CAR-T 制备中进行短暂 2-DG 处理可增强对 CD19+ 癌细胞的杀伤力,这一预测随后与实验室未发表的内部数据高度一致 。 作者明确表示,GPT-5 在此案例中的贡献已达到「共同研究者(Co-investigator)」水平,足以被列为新论文的共同作者 。 2️⃣ 惯性约束核聚变(可控核聚变):6个月的工作量压缩至 6 小时 在可控核聚变的关键技术路径「惯性约束核聚变」(ICF)领域,物理学家利用 AI 搭建了一个热核燃烧波传播模型。 这并非 AI 的全自动表演,而是一场高效的人机协作:人类专家负责物理目标的设定与参数调优,修正 AI 早期不合理的「数值胶带」方案;而 GPT-5 则在几分钟内完成了 PDE 建模、数值代码编写,并最终协助推导了解释数值结果的理论公式 。 研究者评估,这套流程将原本需要「两名优秀博士后耗时数月」的工作(约 6 个人月),压缩到了「6 个人时」,实现了约 1000 倍的效率提升 。 3️⃣ 纯数学:攻克沉寂已久的「未解之谜」 在著名的 Erdős 问题数据库中,GPT-5 协助数学家解决了长期悬而未决的 Problem #848 。在这个过程中,AI 提出了「必要条件 + 稳定性分析」的关键新思路,成功连接了对角与非对角约束,填补了证明逻辑中的关键一环 。 作者形象地将最终的证明描述为「人类数学家前后包夹,中间的关键一步由 GPT-5 完成」。 4️⃣ 深度文献挖掘:跨越学科的「知识虫洞」 在一项凸几何研究中,作者希望寻找类似的定量结果,却收到了一个看似跑题的推荐。GPT-5 敏锐地关联到了多目标优化领域中 Papadimitriou & Yannakakis (2000) 的经典结果 。 尽管这两个领域表面看似无关,但 AI 识别出了底层的数学同构性。受此启发,作者成功改进了自己的定理,消除了原有的对数因子 。 这种跨越学科壁垒的联想能力,往往是人类专家受限于专业背景难以具备的 。 5️⃣ 客观局限与启示 值得注意的是,GPT-5 并非全知全能。报告强调,它经常自信地犯错(Hallucination),甚至试图用错误的数学推导来迎合用户的预期 。目前的成功高度依赖人类专家的「脚手架(Scaffolding)」引导,即由人类将大问题拆解为可验证的子步骤,并严格甄别结果的真伪 。 6️⃣ 结论 我们正在进入「AI 辅助发现(AI-assisted Discovery)」的新时代。AI 的角色正从处理数据的工具,进化为能够进行假设生成和逻辑推理的合作伙伴 。 未来的科研竞争力,将取决于科学家能否精准地向 AI 提问,并具备在它一本正经胡说八道时迅速纠错的能力。 我也翻译为了中文(不过能读懂的人应该是看原文的吧😆): randomarea.com/early-science-…
Zhixiong Pan@nake13

IBM、斯坦福与 UC Berkeley 联手发布:目前最深度的 AI Agent 调研报告 上周,这篇名为《Measuring Agents in Production》的重磅论文发布。团队深度访谈了 300+ 位从业者,整整 47 页的研究揭示了 AI Agent 在生产环境中的真实面貌。 我也 Vibe Coding 了中文版:randomarea.com/measuring-agen… 他们总结了这四个核心结论👇 1️⃣ Agent 的应用、用户和需求是什么? 核心驱动力是生产力,且用户对延迟表现出极高的容忍度。 研究显示,73% 的从业者部署智能体主要是为了「提效」,即减少手动任务所花费的时间。绝大多数系统(93%)是直接服务于人类用户,而非用于机器间的交互。 在需求权衡上,团队明显优先考虑输出质量,而非实时响应:66% 的应用允许分钟级甚至更长的响应时间,仅有 34% 要求亚分钟级的低延迟。深度访谈揭示,之所以容忍这种延迟,是因为即便智能体需要跑上几分钟,其执行效率依然优于人类基准。 2️⃣ 生产环境中使用什么模型、架构和技术? 「简单粗暴」的方法论占主导:弃用框架,重度依赖 Prompt。 70% 的访谈案例直接使用现成模型,完全不进行权重微调(Fine-tuning),而是依靠提示工程(Prompt Engineering)。团队倾向于选择最强大、最昂贵的前沿模型(SOTA),因为相比人力成本,这些模型的开销和延迟依然划算。 数据显示,79% 的已部署智能体严重依赖手动构建的 Prompt,生产环境下的 Prompt 长度经常超过 10,000 个 token。此外,生产环境偏好范围明确的「静态工作流」:68% 的智能体在需要人工干预前最多执行 10 个步骤。 最令人惊讶的是,85% 的案例放弃了 LangChain 等第三方智能体框架,选择从头构建应用程序。组织这样做是有意限制智能体的「自主权」,以确保系统的高度可靠性。 3️⃣ 智能体如何进行部署评估? 自动化基准失效,人工验证仍是核心。 绝大多数已部署的智能体(74%)主要依赖「人」在回路中进行评估。虽然有 52% 的团队尝试使用 LLM 作为评判者,但值得注意的是,每一个使用 LLM 评判的团队,同时也都保留了人工验证机制。 由于生产任务高度垂直化,公共基准测试(Benchmarks)几乎派不上用场。因此,25% 的团队被迫从头构建自定义基准,而其余 75% 的团队甚至在没有正式基准的情况下就上线了,完全依赖 A/B 测试或直接的专家/用户反馈。这反映出针对定制化任务进行自动化评估依然极其困难。 4️⃣ 构建已部署智能体的主要挑战是什么? 「可靠性」是目前最大的拦路虎。 从业者最焦虑的问题是如何确保智能体的可靠性,这涵盖了正确性、延迟和安全性。其中,评估手段的匮乏直接影响了对「正确性」的验证,进而阻碍了可靠部署。 相比之下,延迟问题并不是大碍,仅有 15% 的应用程序将其视为部署阻碍;安全性则被视为一个「可管理」的问题,大多数团队通过设置严格的行动边界和环境约束就能有效缓解。 完整中文版:randomarea.com/measuring-agen…

中文
1
11
40
27.5K
涟漪us🐞🦋 retweetledi
fin
fin@fi56622380·
回顾2025年半导体市场,真的是有太多太多精彩的故事,最大的主题就是: AI需求驱动导致半导体基建的估值体系重构 + 产业链的价值分配重写 从2024年开始,半导体基建正在飞速吞噬整个IT产业利润,SP500里半导体净利润EPS在IT行业里占比,在两年时间从不到20%上升了到了40%,而且还在呈加速上升姿态 半导体整体前瞻利润率从2023年的25%已经升到了2025年11月的43%,已经明显超过了几个互联网巨头的平均利润率,这也印证了半导体利润率超过互联网会是新常态。整个IT产业的利润分配,流向半导体的比例越来越大。 要知道,就算是20~22年的半导体芯片荒,短缺如此严重,半导体的利润率和整个IT利润分配也没有显著增长 这就是故事的上半篇:AI需求驱动导致半导体基建的估值体系重构,不再是互联网时期的基建从属地位 ------------------------ 这个现象背后的逻辑是商业模式随着技术特性的变迁: 互联网时代,每次请求的网络和算力成本,边际成本极低,scaling的效果极好,分发的边际成本几乎为零 在AI时代,这个互联网时代分发边际成本几乎为零利于scalable的特性遭遇了根本性的重大挑战:且不说训练成本从此不是一次性开销而是年年增长,就客户的AI推理请求而言,由于inference scaling成为共识,加上垂直领域仍然需要更大规模的旗舰模型来保持竞争力,推理的成本不会随着硬件算力价格的通缩而同步降低 互联网企业从前的最大成本只有OPEX尤其是SDE人工成本,而现在,互联网公司历史上第一次像半导体厂foundry那样背上高折旧成本的资产负债表,商业模型恨不得要慢慢从“流量 × 转化率”部分转向“每 token 毛利”了 简单的说,互联网时代到AI时代的成本分布,在人力成本opex的基础上又加上了沉重的硬件/算力成本capex(财报里占比:MSFT 33%, Meta 38%)。 上个时代的互联网公司+CSP+SAAS是收租行业里的大赢家,而AI时代,算力(半导体/芯片折旧)成为了新的收租行业,整个IT行业的利润分布发生了剧烈的重新分配(EPS利润流向半导体从20%升到40%而且持续攀升中),这就是半导体基建估值体系重构最重要的原因 --------------- 半导体高利润率的新常态趋势能持续多久? 目前的高溢价来自于前期不计成本的军备竞赛造成的半导体订单积压过多 但很显然,hyperscalers都不愿意当冤大头,都在试图自建ASIC降低成本,那么可以从2030年远期的算力分布来回看这个问题 长线来看,openai已经明牌了标准答案,10GW Nvidia,10GW ASIC,6GW AMD,其他hyperscaler划分比例有类似考虑 比如说,推理端希望ASIC >50%,GPU里再细分的话,AMD和NV(legacy)对半分。训练还是得NV占大头,60%+,剩下的自研ASIC和AMD对半分 2030年按60%推理,40%训练比例划分,算下来NV 38%, ASIC 39%, AMD 23%,跟openAI比例是几乎完全一致的,算是一个标准答案参考值 当然了,微软,Amazon,Google,Anthropic这几家里AMD的比例会比这个标准答案中枢/参考值明显低一些,xAI则是没有ASIC只有Nvidia+少量AMD AMD的风险在于,当2030年再往后的更长期,CSP的in house ASIC越来越成熟(微软除外),推理端ASIC占比可能越来越高,很难有incentive新买入大量GPU了,除非卖的足够便宜 最近风头正劲的TPU呢?Meta是不是要转向TPU?对Nvidia的利润率影响大吗? 实际上,Meta今年capex72B,明年capex110B,未来六年capex平均值可能达到160B附近,而Meta 6年10B的TPU订单算下来年均只有1.6B,而且购买的是TPU云服务,并不是裸TPU 也就是说,Meta这笔TPU订单只占到Meta未来6年capex的1%,并没有严肃的考虑大规模部署,可能只是作为和Nvidia讨价还价的手段而已 另外从Meta最近几个月的招聘广告来看,也并没有看到任何TPU engineer方面的招聘,不像 Anthropic那样从五月就招一堆TPU kernel engineer,十月才宣布大规模采购TPU做训练 所以说,不管原因是diversify供货商,还是给自研ASIC延迟做退路,还是因为AMD的MI350X延迟,Meta买TPU基本上只有一个考虑:增加买Nvidia GPU的议价权,但顶多只有推理份额里能讨价还价,实际效果很有限,对Nvidia利润率影响也很有限。 要知道,22年加密货币熊市矿难的时候,NVDA库存上升到了198天,利润率只是从65%回撤到了56%,算上PE/宏观双杀股价才从300变100,现在一直供不应求,利润率没道理能降下来 再加上TPU v8设计过于保守(没用HBM4),Kyber rack的Rubin方案会比TPU v8的TCO更好,到头来最后还是得继续依赖Nvidia,很难议价。只要Nvidia继续保持这样的大踏步前进,竞争对手其实要跟上还是不容易的。 总之,一方面,全产业链瓶颈,比如cowos扩张都很谨慎,供不应求的状态还能持续多年。 另一方面,AI变现的利润曲线和硬件投入曲线存在“时间错配”,应用端的增长曲线会落后几年,只要这个应用端和基建端的增长曲线的时间错位依旧存在,半导体在IT行业的利润分配就会一直占优势。 从OpenAI的到2030年的投入曲线来看,这个时间错位至少要持续到2030年附近。也就是说半导体行业的超级扩张期带来的在IT产业利润划分的主导地位,目前看至少能持续到2030年 而半导体高利润率可能会维持的更长远一些,因为从互联网时代一次性基建属性变成了现在的收租基建属性 --------------------------------------------------- AI 不是只养活了 GPU,而是在用算力预算把“能把电变成 token 的每一环”都抬了一轮,从内存,存储,互联,光纤,电力,储能…..等等 上半篇讲完了“半导体吞噬IT利润”,那么下半篇讲的就是“AI算力价值溢出效应(Spillover Effect)重塑半导体内部格局”:GPU算力增长 -> 内存/存储/互联/CPU瓶颈 -> 溢出效应 -> 结构性机会 2025 年更有趣的故事,是巨大的行业红利在半导体内部怎么诞生结构性新机会,比如说,一个super cluster需要几个数据中心互联,光纤互联的长度需要上百万mile这个级别,这就是新机会 半导体产业链的结构性趋势带来的新机会,最典型的例子就是内存(DRAM/HBM)和存储(SSD),HBM的需求增长太夸张,连带挤压DDR4/5产能,直接让以周期性为标志的内存行业甚至喊出了“周期不存在”了,Hynix因为在HBM上领先,甚至都开始憧憬起了几年后年利润1000亿美元,妥妥一个万亿市值的公司 这两个板块背后,是结构性趋势的转变:AI workload从训练逐渐往推理延申,推理比例越来越大。 而推理是一个非常纯粹的吃内存带宽速度(memory bound)的事情,可以说带宽速度=token/s。模型尺寸越来越大,以及上下文context length的增加,对内存的尺寸要求也相应增大,导致了内存的需求激增:推理即内存 下一代的的GPU/ASIC内存已经成了暴力美学,配备的内存size之巨大,是三年前无法想象的,回看22年H100的80GB简直像个玩具,这才几年就增长了十倍: Nvidia Ultra Rubin - 1024GB HBM Qualcomm AI200 - 768GB LPDDR AMD MI400x - 432GB HBM 内存的另外一个潜在的爆发点在端侧,也就是手机/PC/汽车/机器人的端侧LLM,这两年主流的手机旗舰机已经从6GB升级到了8GB/12GB/16GB,提前为可能的端侧LLM生态做准备,毕竟手机算力下一代就能达到150TOPS量级,妥妥的桌面级,非常暴力 潜力上来说,端侧内存升级是比云端内存增量要更大的市场,毕竟端侧终端device的数量太惊人了,每年都是billion级别,一旦端侧LLM生态繁荣起来,内存用量翻倍轻而易举,针对端侧低功耗内存/存算一体的各种设计都会跟上 但端侧genAI的软件生态,似乎明显滞后,一直比我想象的进度要慢,可能是因为这方面还处于摸索期,并没有云端那么确定的ROI,厂商们在投入上都很谨慎,我在23~24年时候看好27年,可能还是太乐观了 互联网->移动互联网用了10~15年,端侧genAI/LLM可能也需要7~10年,可能得等云端ROI开发的差不多了,边际收益下降了,才能轮得到端侧genAI/LLM拿到开发资源,跑通端侧ROI。 -------------------------------------- 另一个2025年半导体内部结构性转变的故事是NAND存储,特别是企业级eSSD硬盘 结构性趋势来源也是同一个,AI workload的推理需求越来越大。内存红利也外溢到了SSD存储,甚至HDD存储,因为内存不够用就用高速SSD作为多级缓存 主要逻辑是AI推理过程中内存溢出KV cache offloading到下一层SSD存储,以及向量数据库检索/indexing,都在增加SSD存储的需求 Micron财报说的精准又直白:“AI inference use cases such as KV cache tiering and vector database search and indexing, are driving demand for performance storage.” 至于为什么存储价格在第四季度才爆发,这需要区分一下合约价格和现货价格,合约价格涨幅会温和一些,就算是最紧缺的企业级eSSD合约Q4上涨大概25%。而当NAND产能在2025年被合约慢慢的吃光,现货的价格就造成了观感上强烈的冲击,一个月上涨50%以上。 另一个未经验证的逻辑是多模态的爆发,特别是AI图片和AI视频的需求爆发,也会加剧存储的短缺,我觉得这条线只能说未来可期,但目前的视频/图片精细程度,可能还不到当年GPT3的水平,要达到出圈效果还需要一些时日。 ------------------------ 那么下一步还有什么趋势转移带来的半导体结构性的机会呢 那么就要先看下一步AI推理端的需求趋势是什么,毫无疑问,agentic flow的比例会越来越大,2025并不是year of agent,而是一个decade of agent 从CPU视角去看agentic workload,routing和工具处理都在CPU上,如果把常用的agentic框架做profiling,比如SWE-Agent, LangChain, Toolformer,CPU最长可以占到90%的E2E端到端延迟,throughput瓶颈也更多的卡在CPU,甚至CPU能耗也超过了总能耗的40% Agentic AI目前是一个CPU瓶颈更多的事情,在 agentic 框架里,CPU 是永远在忙的总指挥orchestrator, 很可能会成就CPU需求的新一波回暖 AMD 2025年Q2财报(8月5日),Lisa Su明确表述了这一现象:​"In particular, adoption of agentic AI is creating additional demand for general-purpose compute infrastructure, as customers quickly realize that each token generated by a GPU triggers multiple CPU-intensive tasks." "agent AI的采用正在对通用计算基础架构产生额外的需求,因为客户很快就意识到GPU产生的每个令牌都会触发多个CPU密集型任务。" ​Q3 财报里Lisa又明牌了一次CPU TAM increasing due to Gen AI. "Many customers are now planning substantially larger CPU build outs over the coming quarters to support increased demands from AI, serving as a powerful new catalyst for our server business." Nvidia也是把agent flow视为CPU需求,GB200/300 架构配置的CPU比例也比以往大的多,36颗 Grace CPU : 72颗 Blackwell GPU,直接达到了1:2的水平,AMD的路线则是用1~4个256核的EPYC去服务MI400系列72~128个GPU 以后的硬件架构,一定会往优化agent workload方向发展,比如agent task graph的调度和load balancing,CPU/GPU协同micro-batching 算力上的比较,说不定以后也会摆脱现在的纯GPU token rate比较,转向整个系统级全栈agentic benchmark比较. -------------------------- 半导体结构性转变带来的机会同时,下一步,可能也会带来一些意想不到的次生效应 云端AI数据中心需求爆发,造成内存和存储的暴涨,给消费电子的成本带来了很大压力,在2026年,这也许会演变成消费电子产业潜在的黑天鹅 PC厂商最近的股票大跌,也是这个原因。HP已经说了要减少内存配置,暗示要把PC重回8GB内存+256GB存储的时代了。 DRAM内存和存储再这么涨下去,可能会出现很离谱的情况:内存/存储现货价格比CPU和GPU还要更贵。尴尬的是,这可能直接延缓了消费电子期望的AI PC的进程,毕竟大内存是更有利AI PC的表现力的。 夸张的说,每个PC厂商和手机厂商的员工,甚至是消费电子厂商的员工,都应该买入存储和内存,作为职业风险对冲 明年年初开始,安卓阵营的内存以及存储成本要压不住了,三星,小米的手机售价都提高的话(美国市场现在已经提高不少了),利好最大的就是苹果 苹果的内存产能,nand产能都是专属长约锁价特供的,顺带还把Kioxia给坑了好多不涨价产能,导致苹果的成本优势进一步扩大,苹果全球手机销量市占率增长可能会非常可观,接下来一阵子可能会是iphone辉煌的时光。 ----------------------- 2025年半导体市场真的是太多精彩的故事了,Nvidia/AMD/TPU和各家hyperscaler的恩怨情仇引得各路下注的吃瓜群众心情跌宕起伏。 HBM/内存厂商吃到了memory-bound的红利,NAND厂商意外收获了KV cache的溢出效应,CPU在沉寂近十年后,可能会因agent orchestration再次回到增长叙事的中心 不再是Nvidia/AVGO几家算力厂商独大,而是AI workload算力价值溢出后的每一次演进,从训练到推理,从文本到多模态,从单模型调用到agentic flow,都在重写产业链的价值分配。 云端AI的繁荣正在挤压消费电子的生存空间——当PC厂商被迫讨论重回8GB时代,苹果却因供应链优势坐收渔利。这场算力军备竞赛的次生效应,可能在2026年以意想不到的方式重塑整个消费电子格局 半导体的故事不再是一条单线,而是一张持续自我重构的网。而 2025 年,大概只是合纵连横的第一回合
fin tweet mediafin tweet mediafin tweet media
fin@fi56622380

芯片只有AI火热,半导体的2024年基本延续了2023这个基调 只要蹭上AI相关的叙事,股价增长表现都是接近翻倍或者更高,毕竟这是确定性的增长机会,PE都会给的很有想象力 蹭AI失败典型就是高通,微软的recall功能跳票,导致AIPC/端侧LLM叙事直接破产,股价高点下跌不少,就算赢了跟ARM的官司也无济于事 微软跳票+苹果apple intelligence乏力+安卓碎片化,今年端侧AI/LLM只能这么评价:存在感基本为零 端侧LLM功能开发是heavy lifting,即便端侧算力完全达标了(手机端NPU算力去年已经75TOPs了,非常暴力,标准的桌面级,两年内到150Tops问题不大),端侧LLM生态也还没有那么快,还需要SDE们的持续爆肝。我还是和一年前观点类似,看好26~27年才会有比较显著的进展和丰富一些的玩法 端侧AI目前唯一的热点就是智能眼镜,Meta的Rayban眼镜只是个原型,AI功能实用性基本可以忽略,也卖了两百万,整个智能眼镜市场全年接近四百万销量,风头超出了所有人的预期,PMF得到了验证 虽然目前的智能AI眼镜跟LLM半点关系都没有。24~25年主要的端侧AI部分就是眼球追踪和手势追踪,顶多加上OCR,毕竟眼镜只有那么一点点算力,功耗要求也过于严格(<1w)比手机低了一个数量级 下周的CES在端侧AI基本上就是AI眼镜主题秀,说百镜大战可能有点夸张,但差不多就是这个热度,是典型的Hype没错,但未来可期也是真的 -------------------------------------------- 另一个蹭AI失败的Micron,则是因为PC和手机端的DRAM需求比预期疲软,股价涨了一阵跌回原地。毕竟PC和手机端内存是大头,HBM的占比暂时还是太低了,难以撑起AI叙事,7倍的forward PE低的令人发指 AMD是个例外,蹭上了AI竟然还是跌的,2025的PE也低到竟然只有17。各家CSP都热衷于自研model->compiler->asic accelerator从上到下一整套解决方案提高performance,ASIC赛道的火热,让AMD和Nvidia在同一个赛道火拼,只能说CUDA积累的生态优势恐怖如斯 ------------------------------ 蹭AI姿势最成功的,莫过于给各家互联网云厂CSP们做ASIC AI加速器的Broadcom和Marvell,都是直接靠画饼就能翻倍,太可怕了(以及即将蹭上的MTK/AICHIP) 这大概是2024年最大的的芯片风口转型故事 其实帮互联网公司做ASIC AI加速器对于传统半导体厂商并不是特别有挑战性的事情,对IP的要求并不高,主要是做SoC的infra从前端到后端整个配套设施,核心core ML加速器+上层compiler都是互联网公司自己做。 只要服务态度好,客户支持到位,要求什么就给什么,价格合理,门槛并不是那么高。除了互联interconnect IP,基本上可替代性比较高 所以MTK这种云端NPU经验并不多的芯片厂,也能当Google TPU V7之一的供应商 大公司deploy自己的model时,现在都喜欢用自己的asic配套自己的compiler,自己做的asic明明在纸面功耗比上(TOPs per watt)比H100差了不少,甚至能到40%,要花大力气用自家的功耗比并不是那么好的asic,表面上来看并不合算,除了控制成本(和NV讨价还价),为什么还要自己做? 简单的说,各种深度学习model/workload的瓶颈都不一样,很难有通用的解法,卖家标称的纸面性能/功耗比,并不能代表实际日常的实际表现 公司即便是把H100拿过来用,不经调试直接跑自己的model,其实根本跑不到Nvidia标称的性能performance,差距非常明显 如果要跑出理想的performance,要去研究model怎么适配CUDA做优化,甚至需要改compiler里面的一些参数,所以即便是Nvidia,也会派人给大客户针对他们的workload去optimize/tune CUDA/compiler层 而如果大公司比如meta用自家的model/compiler和hw全套,特定的workload会比其他家的ASIC比如高通的AI100 性能要高数倍 因为自家的模型运算细节自己都了解,可以针对自己的model改compiler和芯片,model的size等各种参数达到最好的效果,从内存分配逻辑,kernel tuning,数据精度,tiling,流水线pipeline结构去从硬件的角度迎合上层model的优化,性能差距会非常大,这是一个上层应用决定硬件形状的时代 如果meta用高通的SDK+compiler+ASIC全套,没有办法针对自己的model去优化,只能用高通的东西去sweep各种参数,这里说的sweep意思是高通的SDK和编译器允许用户调整一些参数(例如线程块大小、内存分配策略、流水线深度等)来优化特定operator的性能。用户会尝试不同参数组合,以找到性能的sweet spot 而sweep参数获得的性能优化会比较有限 这就是为什么最后大公司比如meta的model运行在高通的asic上面的performance,反而会不如自己家看起来功耗比更差的全套compiler+ASIC ----------- 为啥CSP们要自己做芯片的同时又外包给传统半导体厂商呢? 一块SoC里大部分IP,包括Cache/memory,CPU,DSP,high speed IO, boot以及低功耗控制,需要的人力是很多的,但只是提供了一个承载ML加速器运行的infra平台,对于互联网厂家来说没有任何自己做的必要,CSP们只会对直接影响ML加速器部分的内容感兴趣 芯片这个圈子太小了,而且前端后端各个角色之间隔行如隔山,挖人不容易,无法在短时间内招到一个磨合良好的团队稳定的迭代项目。Goole/Amazon/Microsoft/Meta这几家开出高出市场价很多的薪水四处挖角,silicon team也都只是几百人到一千人的规模。一般来说从零开始组建一个不错的大厂silicon design house成型,起码要十年时间 所以给成熟的芯片大厂外包做是一个很合理的选择 ------------- 那么CSP们会不会自己做了ASIC然后往外卖和Nvidia竞争呢? 不会,因为这些ASIC组成立的目标KPI就是节约了多少成本,专门做这个生意风险和投入不成正比,芯片支持多个客户的成本是上升很多的,完全没有必要 这也是为什么这些ASIC组在制定架构指标时比较省心,直接对标Nvidia下一代的Tops以及带宽指标就行,同算力功耗多了50%也无所谓,靠后期compiler和针对性架构来弥补,反正只要能节省成本不被Nvidia压榨就行 ----------------------------- ASIC AI加速器故事即便在2025~2026年,其实也还是整个市场占比很小的小众市场,Nvidia仍然是这场LLM科技革命里毫无疑问的基建期唯一大boss 至于openAI/Anthropic能不能像2004年的Google/Facebook一样,成长为这一轮浪潮里的新巨头,那就拭目以待了 2025年的半导体,AI作为主旋律的日子,怕是还会持续。不过其他领域的复苏,比如汽车电子的增长,还是比2024要好看些的 2025除了AI主旋律外最大的看点,就是intel的18A制程量产效果能否如期落地,这可能是2025影响产业格局最大的事件了

中文
88
381
1.3K
864.3K