JASON CHAN

49.6K posts

JASON CHAN banner
JASON CHAN

JASON CHAN

@phantom2008012

日本語が下手の香港人。趣味は株、ゲーム、アニメどか。

Katılım Aralık 2012
1.2K Takip Edilen1.2K Takipçiler
Sabitlenmiş Tweet
JASON CHAN
JASON CHAN@phantom2008012·
Note更新、「2025のまとめ雑感と2026(妄想)展望について」 ちょっと長いと雑ですか、参考になれば幸せです。 note.com/jason_chan/n/n…
日本語
0
3
15
6.8K
JASON CHAN
JASON CHAN@phantom2008012·
NGKが上がっているで、そうゆう事か…
日本語
0
0
0
44
JASON CHAN retweetledi
fin
fin@fi56622380·
华为τ scaling定律营销策略,无非是more than moore的广义摩尔定律的另一种说法而已 作为芯片架构师,我更感兴趣的,还是芯片密度提升,ppt上41%能耗提升和12.7%性能提升,到底是怎么实现的 看完了论文,感觉华为这次创新,本质上是用设计复杂度高 + 高制造成本 + 超前散热,一定程度弥补了工艺差距 ----------------- 1. 华为芯片堆叠带来的等效密度提升,是虚假宣传还是真的,是不是工艺突破?有没有实打实的好处? 等效密度提升的来源,是两片芯片用hybrid bonding技术绑在一起,投影面积理论上能减小一半,但第一代不是全芯片双层折叠,而是选择性折叠关键logic,所以只有大概53%的芯片面积实现了折叠(密度155->238),等到后面几代折叠面积会逐渐增大,到2030年接近全折叠(密度155->292) 这2026第一代等效密度从 2025 年 155 MTr/mm² 跳到 2026 年 238 MTr/mm²,时钟频率也提升了12.7%,功耗比提升41%,表面上看似乎和工艺突破没有什么区别,但有一点重要区别就是leakage power华为从头到尾没有提,只要工艺节点不变,gate leakage、junction leakage 不会因为 3D stacking 自动改善 2030年到2031年的等效密度突变,大概率是来自于2层堆叠到3层堆叠,正如2025到2026年的等效密度突变,时钟频率突变,来自单层到2层折叠 所以从leakage没提这个事来看,这个2031年等效1.4nm,和工艺节点上的突破没有联系。 本质上是用设计复杂度高 + 高成本 + 超前散热 + 超前部署advanced packaging,一定程度弥补了工艺差距 ----------- 那么这样看起来虚假的等效密度提升,有用处吗?好处在哪里? 有的,设计上topology折叠,原来要跑几毫米的水平走线,折叠后变成了几十微米。降低了super buffer/bus的长度,降低了clock tree的深度(clock depth -42%、clock wire -28%),clock skew也带来了改良(-25%),这对动态功耗的改善是实实在在的。部分critical path的缩短,也让时钟频率的上升更容易 所以ppt roadmap上performance的提升,从2025年到2026年上升了12.7%,大部分都是来自于时钟频率的上升(12.7%) 所以好处基本上是topology拆分电路逻辑设计上带来的提升 既然没有实质上的工艺提升,华为芯片堆叠带来等效密度提升的trade off代价在哪里? 三个代价:散热超前发展,设计复杂度高,制造成本变高 最大的代价就是热密度的同步上升,理论上logic on logic都是CPU execution发热最严重的区域,这部分折叠起来相当于功耗密度直接翻倍,但算上41% power efficiency改善,功耗密度仍只比非堆叠方案高40%左右。所以第一代只能对最关键的部分做折叠,大概只占全芯片面积的53%。 所以散热技术也被逼的超前发展,直接上毫米级的MEMS风扇,做micro-cooling fan。 另外的代价就是设计复杂度的变高,critical path的折叠,哪个部分的logic能折叠,折叠之后又会带来从前端到后端的巨大变化要推翻重来 现有的所有EDA工具也不可能支持3D topology,论文自己也承认,full-scale LogicFolding需要全新的3D-native EDA toolchain,把多层stacked dies当作单一连续设计实体处理。哪些logic能折叠、折叠后的inter-die timing closure怎么做,Physical Design(PD)也是难点 制造成本也会更高,被迫超前部署advanced packaging封装,1.5~2um的hybrid bonding + logic on logic都是很有挑战需要显著更高的成本 以前一层wafer做一次光刻;现在两层wafer分别做光刻再bonding,加上hybrid bonding的overlay控制(论文要求<0.5μm)、TSV、KOZ keep-out zone、冗余修复、良率乘法损失,每颗芯片的制造成本和测试成本都要显著上升 -------------------------- 2. Tau scaling这个说法,scaling的到底是什么,这个scaling技术路线是不是一次性的design topology红利?潜力如何?持续进步的空间在哪里? τ Scaling的核心主张是:用时间常数τ替代几何线宽作为全栈优化目标,在器件、电路、芯片、系统四个层级分别压缩特征延迟 公式本身没有任何新物理。"关注瓶颈延迟"是所有架构师都在做的事情。整个行业都知道互联RC是延迟瓶颈,TSMC每一代工艺都在用low-k dielectrics/semi-damascene等手段降RC。把一个众所周知的优化方向包装成"定律"是显然的营销宣传手段,本质是More than Moore的广义摩尔定律的另一种说法 抛开marketing,华为目前所谓RC delay的改善,本质上是芯片堆叠之后,topology距离缩短,让匹配的effective RC都变小,不是RC工艺常数 至于scaling的意思,是能持续发展的一条roadmap。这里的持续改善路径指的是,全芯片堆叠的层数越来越多,从25~30年的2层堆叠,到31年开始的3层堆叠,以后甚至会考虑4层堆叠 第一代折叠技术甚至不是全芯片双层折叠,而是选择性折叠关键logic,所以只有大概53%的芯片面积实现了折叠(密度155->238),等到后面几代折叠面积会逐渐增大,到2030年接近全折叠(密度155->292)。2031年的roadmap之所以会出现一个阶跃,就是因为那是从2层折叠到3层折叠的时间点。 但需要注意的是,这个scaling方法的边际效应是逐渐缩小的,折叠成双层的收益是100%,2->3层的收益就只有50%,如果2035年再从3->4层堆叠,收益就只有33%了 另外随着堆叠层数变高,上面说到的三个挑战,散热,设计复杂度,成本,都是越来越大 --------------------- 3. 华为的芯片堆叠,是不是TSMC/AMD已经有的hybrid bonding技术?华为做到的是cache on logic,cache on cache,还是logic on logic,logic on logic最大的散热问题是怎么解决的? 是已经有的技术没错,但同时也是把现有技术指标做到了领先也是真的,3D堆叠本身不是新技术,TSMC的hybrid bonding量产还是6um,华为论文给出Kirin 2026的hybrid bonding pitch是1.5μm 我在刚刚看到华为的堆叠消息之后,第一反应也是怀疑和AMD的3D V cache类似,它主要把 SRAM cache 叠在 已经有的L3 cache 区域上,通常会避免直接堆在最热的 CPU execution logic 上,就是避免散热问题,毕竟SRAM 的功耗密度和热点特性与high-activity logic 不一样,如果最热的logic on logic堆叠,散热恐怕会碰到困难 但看了更多数据之后,clock buffer -56%、clock depth -42%、clock wire -28%,这些只有在core内部的clock distribution被重构时才可能发生。纯SRAM stacking不会碰core内部的clock tree。另外如果只是cache on cache,大概率是不需要单独MEMS微型风扇额外散热的,证据普遍都指向logic on logic方式 华为这个技术的精妙之处在于,logic on logic 折叠之后热密度并没有翻倍,而是因为topology的好处,能耗下降了30%,这样热密度只上升了40~50% 而第一代没有完全把整个最热的execution logic 100%堆叠起来,论文也明确说selectively applied along key critical paths,只是大概53%有选择性关键路径会堆叠起来,可能颗粒度都没有那么好,只是IP堆叠在IP上,那么热密度上升也许能维持在20%以内 但这条道路继续前行,超前发展的散热就成了必然,现在是MEMS微型毫米级的主动散热风扇,紧贴处理器传导效率高,和华为手机一样,散热堆料特别足,而且技术领先同行。 以后怕是要把HBM7/8的微流道散热技术提前用起来了,毕竟HBM7/8要上24+层堆叠,华为很可能要在提前用上下个世代的散热技术了 ------------------------- 4. 从架构角度来说,最重要的问题,华为41%的power efficiency(能耗比)提升,到底是怎么实现的?为什么AMD的3D V cache没有这么大的提升? 首先确定41%的定义。论文只说"SoC performance-core power efficiency improved by 41%",没有给出benchmark名称、Voltage/Freq点、温度条件、功耗边界。但PPT roadmap上有一个关键线索:ISO-Power Performance的数字,2025年是2.75,2026年是3.1,提升12.7% 这个时钟频率提升12.7%完全一致,可以理解为,同功耗的性能提升是12.7%,绝大部分是时钟频率提升带来的 至于能耗比上优化的猜测是,LogicFolding缩短critical path → 在固定Vdd下Fmax从2.75GHz提升到3.1GHz → 这意味着在原来的2.75GHz频率下,有了约12.7%的timing headroom → 这个空间在iso-performance模式下可以换成更低的Vdd 另外的能耗比的提升,可能也来自于电路折叠之后,cache hit latency的下降。从业界经验来看,一般L2/L3 cache hit latency下降10%,CPU整体性能会有至少5%的提升 ppt里显示SRAM latency下降30%,估计会有一部分转化为cache hit latency的下降 AMD的3D V cache没有这么大的提升,主要是因为AMD的底层logic die并没有重新设计,3D cache的延迟latency不仅没有减小反而加大,只是增加了cache大小,收益不如latency下降那么明显。 另一方面,clock skew的下降,critical路径变短,造成电路timing变好,意味着华为可以使用更低的vdd(猜测甚至能低7~8%),以及路径缩短所带来的RC的下降(考虑到clock buffer -56%、wire -28%、SRAM pJ/bit -24%这些数字,比如C_eff下降10~15%合理),再加上clock tree的整体缩短和下降,确实是有可能在部分Voltage/Freq点做到同性能下,做到30%的功耗下降的,而30%的功耗下降换算过来就是41%的power efficiency 对比苹果和高通,每一代手机芯片在iso-power下单核性能一般提升10-20%,iso-performance下功耗一般降30-40%,这是V/F曲线的特性决定的,所以从经验上来说,数字是对的上的。 所以这个power efficiency(能耗比)的提升,从现有的数字上来说可以从topology推导出来是合理的,可能真的和工艺节点没有太大关系 ---------------------------- 5. 这个技术路线有没有可复制性,其他家会不会效仿? 短期内不会大规模效仿,因为性价比和风险收益比来说不好。长期来看,这个方向所有人都在走,只是名字不一样 华为做LogicFolding的根本驱动力是制裁,工艺节点被卡在7nm,只能在封装,散热,和设计层面想办法弥补。华为也为此付出了不小的代价:散热成本,设计复杂度,以及制造成本更高(包括良率)。这是一个被逼出来的路线,不是一个自然选择 其他玩家在用TSMC就能做到正常的经济迭代,是没有必要冒着这个风险,去超前迭代散热技术和设计复杂度的 长期来看,Intel的Foveros、TSMC的SoIC、AMD的MI300的3D stacking都在朝同一个方向走。如果继续追最先进节点的经济性持续恶化,那么"固定一个成熟节点+3D topology optimization"的路线会越来越有吸引力 散热方面,MEMS微型风扇和微流道也会成为未来HBM散热的主流 ------------------- 总结一下,华为这次的创新,绝对是值得尊重的,在制裁环境下,用极高的设计复杂度和成本,在一个被锁定的工艺节点上大胆重新设计,榨出了一次大的topology红利,虽然它有天花板。每多加一层的边际收益递减(堆叠1->2层, 2->3层, 3->4层,提升百分比变小),leakage无法解决,散热越来越难,3D EDA工具链更是全新的挑战。 但这个Tau scaling不是一条可以走十年的指数增长路径,每次爬完一个台阶,下一个台阶更难爬,而且台阶更矮收益更小,华为以后想缩小差距,还得再想想靠什么其他的路线
fin tweet mediafin tweet mediafin tweet mediafin tweet media
中文
117
310
1.2K
343.5K
JASON CHAN retweetledi
Mossad Commentary
Mossad Commentary@MOSSADil·
Israeli airstrikes on the city of Nabatieh and the towns of Haboush and Touline, southern Lebanon.
English
4
12
74
9K
JASON CHAN retweetledi
浜松ホトニクス株式会社 - Hamamatsu Photonics K.K.
【日本電子株式会社「LazEdge レーザー加工SEMシステム」に当社製レーザーが搭載!日本顕微鏡学会 第82回学術講演会のセミナーにてご紹介】 日本電子株式会社 (JEOL Ltd.)が本日5月25日に販売を開始する「LazEdge」に、浜松ホトニクス製のレーザーが搭載されています。近年高まりを見せる「高品質・大面積・高速」なレーザー加工への需要に応える走査電子顕微鏡システムとして、開催中の「日本顕微鏡学会 第82回学術講演会」のセミナー (No. LS-13)にて当社社員も登壇して詳細をご紹介します。同学会へご来場の方は5月26日 (火)G会場にて行われるセミナーにもぜひご参加ください。 conference.wdc-jp.com/microscopy/con…
浜松ホトニクス株式会社 - Hamamatsu Photonics K.K. tweet media
日本語
0
5
38
12.6K
JASON CHAN
JASON CHAN@phantom2008012·
@Leoskie_L Haha. I guess your post is funny. However, it's a little bit hard for my Japanese friends to understand, so I ask AI to rephrase the idea. Many thanks for always sharing the ideas.
English
0
0
1
18
Leonard
Leonard@Leoskie_L·
ha ha thanks for sharing this. I find myself hard to chew and gone thru all the technical stuff. doing my best to make it as easy as possible. just saying , this result might have been sprout out from a happy researcher, because his GF is nice to him since the company doing well .
English
1
0
1
99
JASON CHAN
JASON CHAN@phantom2008012·
引用元の例え話が面白すぎますが、これ、SK hynixの技術発表、半導体業界的に何がすごいのか分かりやすくAIに任せてまとめました。 🔥そもそも何が問題だった? 最新のAI用メモリ(HBM)は、性能を上げるためにチップを何層も重ねます。でもそうすると中間層の熱が逃げず、熱暴走を防ぐために「あえて処理速度を落とす」しかありませんでした。 ❄️SK hynixはどう解決した? 精神論(ソフトウェア制御)ではなく、物理(ハードウェア構造)で殴りにいきました。 1. MR-MUF(熱を逃がす基礎構造) チップの隙間に、熱伝導率のバカ高い特殊材を一気に流し込んで固める独自技術。 2. ICE(今回の主役) チップ内部の「一番データ通信が激しくて熱くなる場所」の真横に、専用の放熱ルート(排熱ブロック)を直接埋め込みました。 例えるなら、熱気がこもる厨房でうちわを仰ぐのをやめて、「一番熱い中華鍋の真横に、業務用の強力な排気ダクトを直接つなぐ」ようなものです。これで熱抵抗を30%もカット。 「熱問題を気にせず、常にAIの性能を100%引き出せる」という、エンジニアの執念が生んだゴリゴリの物理技術。 だそうです!
Leonard@Leoskie_L

SK hynix 相親王者:老婆找到了,員工真的幹活不累了 昨天還在講 SK hynix 是不是快被三星、Micron 追上,結果今天直接丟 ICE 出來。 不是嘴砲,是物理。 ICE(Integrated Cooling Elements)就是把「散熱磚」直接塞進 HBM package 裡,在最燙的 D2D PHY 熱點旁邊,多開一條專用散熱路。thermal resistance 直接砍 30% 以上。以前熱卡在 stack 中間像便當店爐口悶燒,現在等於直接在炒鍋旁邊開排風管。 員工突然不累了。 這東西最狠的是,它不是什麼科幻黑科技,而是接在 SK hynix 已經練很久的 MR-MUF 上。 MR-MUF 白話就是: 以前 TC-NCF 像蓋樓每一層都慢慢貼膠壓合,蓋到後面樓歪掉、熱也散不掉。 MR-MUF 是整棟樓先焊好,再一次灌高導熱水泥。熱路更多、warpage 更少、良率更穩,還能塞更多 thermal dummy bumps。 現在再加 ICE,等於: 以前 HBM 是一個很會賺錢但容易爆汗的工程師,現在終於娶到老婆了。 老婆不會寫 code。 但老婆會散熱。 所以老公可以繼續加班。 這波不是什麼 AI 願景,是很純的工程勝利: 「不要再叫員工忍耐了,我直接幫他開冷氣。」

日本語
1
0
2
504
JASON CHAN retweetledi
口
@tnzk_syk·
日本シイエムケイ、宇宙市場参入強化に向けAstroX社とプラチナスポンサー契約を締結 prtimes.jp/main/html/rd/p… @PRTIMES_JPより
日本語
0
5
12
3.3K
JASON CHAN retweetledi
電ファミニコゲーマー
電ファミニコゲーマー@denfaminicogame·
「小説家になろう」アニメ化200作品突破! 6月より順次開始される3つの新施策を発表 news.denfaminicogamer.jp/news/2605262v 2013年ごろに掲載作品が初めてアニメ化。2010年代半ばを過ぎると『リゼロ』や『転スラ』『オバロ』などが異世界ブームをけん引し、複数のシーズンをまたぐ大作アニメ化も目立つように
電ファミニコゲーマー tweet media
日本語
21
189
546
144.1K
JASON CHAN retweetledi
*Walter Bloomberg
*Walter Bloomberg@DeItaone·
CHINA IS RESTRICTING OVERSEAS TRAVEL FOR TOP AI PROFESSIONALS IN PRIVATE FIRMS SUCH AS ALIBABA GROUP HOLDING AND DEEPSEEK
English
201
458
3.2K
700.7K
JASON CHAN
JASON CHAN@phantom2008012·
台湾証券取引所(TWSE)は、6月4日にCOMPUTEX期間中にハイプロファイルなメディアブリーフィングを開催し、7社の主要上場企業を招き、半導体とAIインフラストラクチャという2つの大規模テーマに関する独占的な洞察を共有します。 注目企業: • Alchip (3661) • Msscorps / 汎銓 (6830) • ナンヤテクノロジー (2408) • ユニミクロン (3037) • AVC 奇鋐 (3017) • デルタ・エレクトロニクス (2308) • ウィストロン (3231)
LIWEI_TW Capital@LIWEI_TWCapital

The Taiwan Stock Exchange (TWSE) will host a high-profile media briefing on June 4 during COMPUTEX, inviting 7 leading listed companies to share exclusive insights on two massive themes: Semiconductors and AI Infrastructure. Featured companies: • Alchip (3661) • Msscorps / 汎銓 (6830) • Nanya Technology (2408) • Unimicron (3037) • AVC 奇鋐 (3017) • Delta Electronics (2308) • Wistron (3231) #COMPUTEX2026 #AI

日本語
0
0
3
646
JASON CHAN
JASON CHAN@phantom2008012·
相当地獄かと思うね
日本語
0
0
0
74
JASON CHAN
JASON CHAN@phantom2008012·
ファンドがここで無理に売りを抑えようとするなら、この銘柄だけでなく、本尊が推している他の銘柄も売り崩さない限り、個人がパニック売りをそうそう起こすことはないんじゃない?それに、他の銘柄の含み益によるバッファも相当厚いよね で、昨日は売り増ししたらしいし、今下がっているうちに、昨日売り増しした分のカバーができるかどうかが🫠
JASON CHAN@phantom2008012

例の銘柄、技術路線で少し持ってたけど、もう需給が主役だなこれ。ショート踏み上げの祭り状態。ここから追い打ちでファンドの買いが入るとか…ショート勢、マジでご愁傷様

日本語
1
0
0
177
JASON CHAN
JASON CHAN@phantom2008012·
(続)
JASON CHAN tweet mediaJASON CHAN tweet mediaJASON CHAN tweet mediaJASON CHAN tweet media
日本語
0
0
0
195
JASON CHAN
JASON CHAN@phantom2008012·
WinWayの動画でCPOに関する情報
JASON CHAN tweet mediaJASON CHAN tweet mediaJASON CHAN tweet mediaJASON CHAN tweet media
P Equity Research 📰@pequityresearch

This is an amazing video recommendation from Jukan about CPO. _______________________________________________________ NPO is still 50% copper, 50% optics. The real CPO ramp is unlikely to begin until 2027 when 2.5D CPO will have 20% copper and 80% optics. In 2030, the split will be 100% optics in 3D CPO (COUPE XPU) The true hurdle is in maintenance for CPO in 2027 and 2030. Pluggable/OBO/NPO (Green/Yellow): If an optical laser or engine fails, field technicians can easily hot-swap a pluggable module at the faceplate, or replace an NPO module on the board without tossing the expensive ASIC. 2.5D & 3D CPO (Red): Once the PIC and laser/optical components are physically bound inside the package or stacked directly under the ASIC, they can no longer be individually serviced. If a single optical component fails, the entire high-value compute engine (the XPU/Switch) is essentially bricked. _______________________________________________________ CPO supply chain, per @semivision_tw: 1. CSP Nvidia $NVDA AWS $AMZN Meta $META ByteDance Microsoft $MSFT 2. SOI Wafer Soitec ShinEtsu SEMCO IntelliEPI 3. Connector Amphenol Senko US Conec T&S Communications Samtec LightSense Siemon 4. Testing WinWay MPI Co. Hon Precision Chroma 5. Fiber Corning $GLW YOFC Sumitomo Electric FiberHome Prysmian ZTT Fujikura Futong Group Hengtong Fiber 6. ELS Furukawa Electric Broadcom Lumentum Sumitomo Electric TE Connectivity Coherent O-Net Technologies 7. PIC Design & EDA IBM $IBM Intel $INTC Sicoya MACOM $MTSI Juniper Cisco $CSCO SiFotonics POET Technologies $POET Ansys - part of Synopsys Ayar Labs Fujitsu Marvell $MRVL Lumentum $LITE Infinera Huawei Ranovus Cadence $CDNS Skorpios Synopsys $SNPS OpenLight 8. Foundry TSMC $TSM Intel $INTC Tower Semi $TSEM Applied Optoelectronics $AOI Silex GlobalFoundries $GFS Samsung United Microelectronics $UMC Acacia STMicroelectronics $STM 9. EIC & DSP Design Broadcom $AVGO Coherent $COHR Lumentum $LITE Infinera Ciena $CIEN MACOM $MTSI 10. Light Source LandMark Optoelectronics Coherent $COHR IntelliEPI iQe NICHIA Sumitomo Electric

日本語
3
8
58
13.6K