Strider/acc

15.4K posts

Strider/acc banner
Strider/acc

Strider/acc

@Strideracc

这没啥好看的

Cloud Katılım Nisan 2011
767 Takip Edilen453 Takipçiler
Strider/acc retweetledi
Micro 小熊猫
Micro 小熊猫@xxm459259·
人生有时候也需要有一个 /goal 模式,至少某一段时间应该有一个,不然总是被莫名其妙的 /btw 给叉出去,有时候隔了好几年才能叉回来。
中文
2
6
79
7.1K
Strider/acc retweetledi
Bread🍞
Bread🍞@himself65·
美国基本上就是打输了,没拿到铀
中文
89
3
326
126.5K
Strider/acc
Strider/acc@Strideracc·
@labubu_trader I don't have any concrete evidence, but I have a strong feeling that the negotiations between Iran and the US will ultimately fail. I might be overly pessimistic, though.
English
1
0
0
359
Diyas.Σίσυφος(embracing bubble)
One simple reason cpo wont replace hbm is delay. Done. Pam4 dsp is take much longer, delay is the biggest drawback. hbm delay is only 100ns. now with cpo it can be 500ns-1us due to pan4 adc/dsp delay, adding back memory wall. Funny hah.
Fiona ❤️& ✌️@nft_hu

为何会提出光互连解决当前HBM封装的极限? 最本质的原因是:我们正在一步步接近HBM封装的极限。 一、物理规律的极限被逐渐触及: 极限1️⃣:垂直堆叠层数——已触顶 HBM的堆叠演进:HBM2(8层)→ HBM2E(8层)→ HBM3(12层)→ HBM3E(12/16层)→ HBM4(计划16–20层)。 每多叠一层,TSV(硅穿孔)的深宽比就要提高。目前16层的TSV深宽比约为20:1,这是电镀铜填充工艺的极限边缘——再往上,铜填充时气泡无法逸出,良率断崖式下跌。 更深的问题是热阻叠加。每层DRAM die的导热路径要穿越所有下层芯片才能到达散热器。12层堆叠时底层die的结温(junction temperature)比顶层高约15°C,20层时这个差距会超过25°C,已经超过DRAM工作安全边界。 这都导向一个事实——垂直方向的物理扩展空间已所剩无几。 极限②:硅中介层岸线——已触顶 GPU的「岸线」(shoreline)是GPU die四周边缘的物理周长。HBM堆栈通过硅中介层与GPU并排,HBM的数量上限就是:GPU周长能容纳多少个HBM接口宽度。 假设GPU die最终做到一个reticle极限,周长约为130mm,单个HBM4堆栈接口约需4mm,理论上限约为32个堆栈——但实际上电源/信号走线、角落利用率等因素会把这个数字压到16–20个以内。 极限③:带宽密度(单位面积IO数)——接近极限 Microbump的物理极限大约在25–30μm pitch,低于这个数字,焊锡球的表面张力和对准精度无法维持量产良率。 极限④:功耗密度——这是最被低估的极限 HBM3E每栈满载功耗约15W,8栈就是120W,加上GPU本身的600–700W,整个封装的功耗密度已经超过100 W/cm²,相当于火箭发动机喷口附近的热流密度。 散热才是最硬的物理墙。 HBM越叠越高,散热路径越长,这是垂直堆叠无法回避的热阻叠加问题,与材料科学的边界直接碰撞。 ————————————————————————— 二、光连接的解法 电信号传输本质上是在用「极短距离」这个物理条件换取优势。 光的优势恰好在电的弱点处显现——光信号的带宽与距离几乎无关。当GPU与HBM的物理间距被迫增加,光互连的相对优势就从「理论上可行」变成「工程上合理」。 ————————————————————————— 三、目前技术架构的可能形态 方案A:光学Bridge芯片 在硅中介层中嵌入硅光子波导层,GPU与HBM之间的信号不再走铜线,而是走片内波导。距离仍在毫米级,但打破了「必须紧邻」的约束,允许HBM在中介层上远离GPU边缘排列。 这是Ayar Labs(与Intel合作)的TeraPHY路线,已在2024年实现单chiplet 2Tbps光I/O,且可3D堆叠于逻辑芯片下方。 方案B:CXL over Optics(推理情况不合适) 将多个HBM堆栈聚合为独立的记忆体池模块,通过CXL协议与GPU通信。距离可达几厘米至数十厘米,直接接入背板。这不是HBM专属光互连,而是把HBM变成CXL记忆体节点。 延迟代价:每次E→O→O→E转换约增加5–10ns,相对于DRAM本身的~150ns访问延迟,约增加3–7%,在大模型训练的流式访问模式下可接受,但推理场景(延迟敏感)会更在意。 方案C:3D光学垂直互连(最激进) 将HBM置于GPU正下方,利用垂直光学通孔(Optical Through-Silicon Vias,OTSV) 实现Z轴方向的光互连。这在理论上消灭了岸线限制(HBM直接在GPU下方大面积铺展),同时保持极短传输距离。 方案D:光子织网 把光子互连fabric做成一个独立的2D芯片层,像三明治一样插在GPU和HBM(或其他加速器)之间,所有芯片通过这层光子层通信。它并不限定是HBM,而是一个通用的光互连基板。 ————————————————————————— 四、这个方案的难点:激光源 这是目前工程界最头疼的问题。 硅不能发光。硅光子可以导光、调制光、探测光,但无法产生光。今天所有硅光子方案的激光源都是III-V族化合物半导体(InP、GaAs基材料),需要外置激光器,通过fiber coupling耦合进硅波导。 这带来: 可靠性问题:激光器是光互连系统中寿命最短的组件 良率问题:光纤与波导的耦合对准精度要求亚微米级,大规模封装良率极低 成本问题:III-V激光器目前仍比硅便宜不了多少,难以摊薄 功耗问题:激光源本身的电光转换效率约30–40%,是额外的能耗来源 ———————————————————————— 五、解决路径: 1️⃣直接在硅上外延生长III-V材料 Intel、MIT林肯实验室、UCSB都在研究,但良率与可靠性尚未达到量产标准。 2️⃣另一条路是量子点激光器直接长在硅上,理论上可行但仍是实验室阶段。 AXT(AXTI)的潜在价值就在这里——其磷化铟(InP)基片是高性能光互连激光器的关键衬底材料,这条需求链条目前仍处于早期。 ———————————————————————— 六、时间线 2026–2027:板级CPO(GPU与光引擎共封装)进入量产,主要用于scale-out网络,不直接涉及HBM 2027–2029:光学Bridge方案开始进入高端AI加速器概念验证,HBM可能扩展至更远位置但仍在同一封装内 2029–2032:CXL over Optics的记忆体池化开始规模部署,HBM功能性分离 2032+:真正意义上GPU-HBM光互连作为标准封装方案,仍存在不确定性

English
5
0
22
14.9K
Strider/acc retweetledi
Mark Dubowitz
Mark Dubowitz@mdubowitz·
If President Trump agrees to a 60-day ceasefire extension based on vague Iranian promises to “discuss” nuclear issues, it’s game over. That pushes the crisis into late July or early August, when major military operations become far less likely ahead of the midterms. Once the military leverage disappears, meaningful nuclear concessions disappear with it. Ballistic missile restrictions will be nonexistent. Iran will get billions in sanctions relief—while repeatedly using Hormuz as a tool of blackmail. Tehran will have won at the negotiating table what it lost on the battlefield.
English
821
1.3K
5.8K
952.8K
Bread🍞
Bread🍞@himself65·
我老婆才是真正的神,我今天说ARM我忘了买了,老婆说她早就买了;我说油价要上去了,她说她早就买了🫪🫪🫪
中文
17
0
144
27.6K
Strider/acc retweetledi
Jukan
Jukan@jukan05·
Qualcomm provides ASIC services to ByteDance and Amazon.
English
17
40
405
67.3K
Strider/acc retweetledi
Jien
Jien@teppoblog·
Hypervelocity Improved Capability Assault Rifle (HICAR) 米軍SOCOMがURG-Iの後継として計画している高圧5.56ライフル。M855A1+を使用することで、射程を300m→600m以上に伸ばし、貫通力を向上。銃身長11~12インチ、HUXWRX Black Magicサプに対応、M4ロアと互換性あり。 sam.gov/workspace/cont…
Jien@teppoblog

米軍SOCOM、NAS3や5.56 MAXなどの高圧弾薬に耐えうるM4アッパーをURGIの後継として計画、複数のメーカーから案を募って試験中との噂

日本語
8
86
278
40.5K
Strider/acc
Strider/acc@Strideracc·
明天 #TheBoys 要剧终了,预计又是一个 GoT和怪奇物语似的结局。(不是褒义..) 现在最期待就是结局是不是和网上舅舅党泄露的一样。如果是真的话,那50分钟有点太紧张了吧
中文
0
0
0
159
Strider/acc retweetledi
Macro_Lin | 市场观察员
长鑫存储扩产的设备供应链全景 长鑫现在合肥两座、北京一座,三座12英寸厂。合肥一厂11万片月产能,二厂8万片,北京厂7万片,加起来接近30万片,全部满产。两年涨了三倍,2024年初差不多10万片,2025年底冲到28到30万,2026年目标稳在30万。按晶圆片数算全球DRAM占比已经接近15%,但按销售额算只有3.97%,片数堆上来了,单价还在追赶。 工艺端,G4在16纳米已经量产,DDR5良率从2024年底的80%升到现在的90%区间。G5对应15纳米,2026年底量产。HBM2去年下半年就上了,比外界预期提前两年,主要供华为昇腾910。HBM3的前段晶圆产能主要在合肥和北京现有基地内部腾出来,目标月产6万片,约占30万片总产能的20%。后段的堆叠和封装由上海新建的HBM封测厂承接,2026年底投产。 产能还在继续扩。上海新厂分两期,Phase 1产能10万片,2027年初量产,Phase 2同样10万片,2028年初量产。加上现有的30万片,远期产能目标是奔着50万片以上去的。华为也在建一条10万片规模的产线,专门配合长鑫做昇腾系列所需的HBM3和LPDDR5X,2026年下半年开始全面量产。 IPO募资295亿,DRAM技术升级拿了130亿,量产线升级75亿,前瞻技术研发90亿。多家券商纪要提到其中约200亿会直接变成设备采购订单,叠加2024年712亿的存量Capex节奏,是国产设备厂未来两年最确定的基本盘。 长鑫正在进行的大规模扩产,设备采购需求非常可观。每个品类的国产化进展差异很大。 光刻是最大的对外依赖,国产化率连5%都不到。主力机器是ASML的NXT:1980Di,每小时出275片,覆盖到16纳米节点,目前还能正常采购。被荷兰管制的是NXT:2050i及以上,每小时295片,2023年9月起要许可证,2024年1月起对华许可基本停发。修正一个流传很广的说法,275到295片是1980Di到2050i的代际跳变,不是1980系列内部的迭代。长鑫往15纳米以下走,这道墙绕不开。上海微电子的28/14纳米DUV还在攻关,光刻这一环短期无解。 刻蚀占设备投资25到30%,是国产化最深的核心工艺。北方华创的ICP在长鑫产线上市占超过50%,中微的CCP介质刻蚀机做到50比1以上深宽比,专门用于HBM的TSV深硅通孔。但存储节点100比1深宽比的极端工艺,孔洞必须互相平行规整,任何偏差直接砸良率,Lam和东京电子在这个区间仍然是主力。 薄膜沉积占约25%,品类分得细。PECVD做绝缘层,PVD做金属互连,ALD做电容器的高k介电层。拓荆科技的PECVD已经批量进入长鑫DDR5和LPDDR5产线,北方华创的PVD覆盖铝铜溅射和氮化钛溅射。但DRAM电容器核心的高k ALD设备,应用材料和ASM的位置很难动,拓荆的ALD在验证爬坡中还没有大规模上量。整体看PECVD和PVD的国产化率高一些,ALD最低。 CMP只占设备投资5到7%。华海清科占国产CMP装备销售90%以上份额,12英寸Universal-300已经导入长鑫。新变量是中微4月29日刚过会的收购杭州众硅,6抛光盘架构是国际首创,效率比主流4盘方案高一截。国产CMP从单点供应正式进入双供。 清洗国产化率30到40%,盛美上海的SAPS/TEBO兆声波清洗覆盖FinFET和DRAM的16到19纳米制程。热处理40到50%,北方华创立式氧化炉打头,激光退火端莱普科技两年内国内市占从3%涨到16%,跟长鑫和长存共同开发匹配DRAM工艺的设备。这几个环节已经跑通了。 最薄弱的三个环节是量测检测、涂胶显影和离子注入。量检测国产化率个位数,KLA全球占51到54%,精测电子进了长鑫12英寸产线,中科飞测也在部分环节往里切,但高端光学检测和电子束检测差距仍然明显。涂胶显影国产化率仅4%,东京电子在大陆市占超过90%,芯源微是唯一量产替代,目前只在封装端站住了,前道关键层还进不去。离子注入同样个位数,万业凯世通累计交付40多台。弹性最大的三个环节,也是短期内最动不了的三个环节。 长存三期产线2026年一季度国产设备占比首次过50%,目标100%。长鑫设备国产化率已突破45%,但仍低于长存三期产线的水平。根源在工艺。DRAM的电容刻蚀和光刻精度对先进DUV的依赖远高于3D NAND。NAND可以靠堆层数绕过光刻瓶颈,DRAM要正面硬刚,结构性差异,跟意愿无关。 外部约束在收紧。4月22日美国众议院外交事务委员会投票通过了MATCH法案,路透社称之为"国会史上最大规模的半导体出口管制立法审议"。法案把长鑫、中芯国际、长江存储、华为、华虹一起列入covered facility,禁止ASML的DUV浸没式光刻机对长鑫出口,禁止盟国为既有设备提供维保,要求荷兰和日本在150天内对齐美方规则。主要推手是美光。一旦通过,NXT:1980Di这条最后的灰色通道就堵死了。长鑫本身还没进BIS实体清单,但设备进口其实早就在2022年10月那波18纳米以下DRAM工艺限制的笼子里。 45%的国产化率意味着长鑫在两条腿走路,海外设备保良率,国产设备保供应链安全。MATCH法案的压力反而在加速这个进程。长鑫每往国产设备多切一个百分点,对应的就是北方华创、中微、拓荆、华海清科、盛美这些公司实打实的订单增量。上海新厂分两期共20万片的增量产能,加上现有产线的持续技术升级,未来两到三年国产设备厂面对的是一个确定性极高的需求窗口。 从更长的时间尺度看,长鑫的扩产不只是一家公司的资本开支计划。它每走通一个工艺节点,整条12英寸国产设备平台就多一次被验证、被复用的机会。刻蚀和CMP已经证明了这条路径,薄膜沉积和清洗正在跟进,量测和涂胶显影是下一个要啃的硬骨头。这个验证循环一旦转起来,国产设备的竞争力会以远超线性的速度积累。
中文
177
501
2K
938.6K
Ryan Leung 梁興盛, CFA
Ryan Leung 梁興盛, CFA@RYANHINGSHING·
我繼續說我的 $ORCL $MSFT -他們的軟件(ecosystem)受惠於AI -token需求最直接受惠 -CAPEX最終會變成很高ROI算力, 所以不應像華爾街一樣懲罰CAPEX, 而要鼓勵CSP/neocloud投更多CAPEX, 懲罰不敢投CAPEX的CSP -封鎖所有說CAPEX不好的分析師 天天講、月月講、年年講, 與天講, 與地講, 其樂無窮🫡
Ryan Leung 梁興盛, CFA@RYANHINGSHING

現在投什麼: 現在的chokepoint和部分軟件 第一波, 儲存 . 但中國開始做到DDR5了, 各廠商有擴產經驗 第二波, 光通訊. 光通訊產業持續迭代, CPO, 1.6T/3.2T. 加上擴產經驗不足, 例如InP, 封測, 檢測, coupling. 軟件逆轉:之前long sermi, 無腦做空IGV. 投資方面要避開被AI取代的($SNOW, $PLTR, $ORCL)

中文
59
9
95
36.1K
Strider/acc
Strider/acc@Strideracc·
新的这个Gemini Web UI是真不错,终于有对得起之前买的年付Ultra的更新了...
中文
0
0
1
122
Strider/acc retweetledi
FundaAI
FundaAI@FundaAI·
I'd point out that late March was the height of the Iran crisis. Most nimble hedge funds were either adding hedges or trimming positions they thought looked expensive in the short term. Judging their April and May views based on end-of-March 13Fs just isn't fair.
English
4
5
52
17.1K