pirreeee
6 posts


情緒上暫時不再增加 MU SNDK存儲的倉位了。目前還沒看到多少資料
先繼續觀望一陣⋯
Google 新架構的核心:FP4 精準度與 MoR 技術,Google 在近期(2026 年 3 月中旬)宣布其 Google Cloud 的 G4 虛擬機 (VM) 全面支援 4 位元浮點運算 (FP4) 以及 混合遞歸架構 (Mixture-of-Recursion, MoR):
• 記憶體佔用減半:FP4 技術允許 AI 模型在運行時(推論階段)僅需過去 FP8 或 FP16 一半甚至更少的顯存(VRAM)。這意味著同樣的硬體可以運行兩倍規模的模型。
• 動態參數複用 (MoR):MoR 架構透過「遞歸」方式重複使用同一組參數,而非像傳統 Transformer 那樣堆疊數百層獨立參數,這讓模型對系統記憶體的依賴性下降了約 25% 至 50%。
為什麼市場認為「需求會減少」?(短期利空)
投資人目前的擔憂主要來自於「記憶體荒」紅利的消退。過去兩年,Micron (MU) 和 SanDisk (SNDK) 的股價飆升是因為 AI 模型「太笨、太胖」,必須堆疊海量的 HBM (高頻寬記憶體) 和 SSD 才能跑動。
• 打破「規格門檻」:
過去一個 100B 參數的模型可能需要 8 張 GPU 才能載入;現在透過 FP4 (4位元浮點運算),同樣容量的記憶體可以塞入 4 倍的參數資訊。這意味著雲端巨頭(如 Google, Meta, Microsoft)原本要買 1 萬顆晶片的訂單,現在可能只需要 5,000 顆就能達到同樣的算力輸出。
• 終結「無謂的堆疊」:
MoR (混合遞歸架構) 透過參數複用,讓模型不再需要幾百層獨立的 Layer。這種「以時間換空間」的邏輯,直接減少了對物理記憶體容量的剛性依賴。
中文






