larayeh

109 posts

larayeh banner
larayeh

larayeh

@larayeh

給小時候的自己閱讀的科普童話

Taipei City, Taiwan Katılım Temmuz 2009
237 Takip Edilen11 Takipçiler
larayeh
larayeh@larayeh·
💻近端策略優化PPO的十四行詩💻
A Sonnet of Proximal Policy Optimization 舊我站在原地,新我急欲前行,
The old self stands its ground, the new one strains to go, 比值超過限制,截斷之手拉回,
When the ratio climbs too high, the clip will pull it low. 不要學得太快,每步細算代價,
You cannot learn too fast; each step must count its cost, ε 是繩,逾越便是損失。
Epsilon draws the leash — beyond it lies the loss. 十四行至此轉折,策略開始猶豫,
Here at the sonnet’s turn, the policy hesitates, 並非懦弱,是智慧避免崩潰。
Not cowardice, but wisdom: leaps too far it breaks. 舊我非敵,是穩固港灣,
The old self is no foe — it is the anchor, the safe shore, 新我在旁,寸步挪移,緩慢向前。
The new self stays nearby, inching just a little more. 截斷之手溫和,ε 守護,
The clipping hand is gentle, Epsilon holds true, 克制之中深藏真理。
In restraint we find the truths we never need to pursue.
larayeh tweet media
日本語
0
0
0
47
Strike
Strike@5tr1ke·
@user_ops @nvidianewsroom I get if he shares it on his personal account. But on NVIDIA’s official accounts? Whats this got to do w GPUs?
English
5
1
1
727
NVIDIA Newsroom
NVIDIA Newsroom@nvidianewsroom·
Dinner with the Huangs. Jensen joined his parents for a family meal and took a moment to share fried mantou with local media gathered at the restaurant.
NVIDIA Newsroom tweet media
English
147
305
3.8K
289.5K
larayeh
larayeh@larayeh·
🌈The Rainbow Sonnet The sun breaks through the rain-washed afternoon, And meets the floating spheres of liquid glass. Each prism grants a geometric boon, As beams of white through heavy vapors pass. Refraction bends the rays at entry’s gate, Dispersion frees the wavelengths locked inside. For red and violet choose a different fate, By index of refraction they divide. One internal bounce creates the primary bow, Where red defines the arc's outer domain. Two bounces make the secondary glow, A flipped and fainter twin above the rain. No artist mixed these bands of living light, Just speed and angle in the human sight. 🌈彩虹的十四行詩 陽光穿透雨後的午後, 遇見懸浮空中玻璃般的水珠。 如微小稜鏡賜予幾何恩惠, 當白光穿透濃郁水氣: 折射光進入水珠邊界時彎曲, 色散釋放藏在白光中的各波長。 紅光與紫光選擇了不同的命運, 依著各自的折射率分道揚鑣。 水珠內一次反射創造了主虹, 紅光染在圓弧外側。 兩次反射隱現副虹, 是雨幕上方色彩反轉、黯淡些的孿生。 無人調色,是不假人工的生命之光, 只是光速與角度,在人眼中交織的奇蹟。
English
0
0
0
86
larayeh
larayeh@larayeh·
《阿嬤的馬達》 阿緞仔退休那天,工廠送她一個保溫杯。 印著公司logo,裝熱湯不會燙手。她轉手給女兒,女兒也沒在用。 三十年。她做了三十年的定子線圈,手指捲線的角度精準到不需要量,閉著眼睛也知道哪條線繞歪了。但退休證書上寫的是「作業員」,她自己也這樣跟人說:「我就是工廠的啦,做零件的。」 退休兩年,她加入了社區的銀髮遊學團。 這次去日月潭,遊覽車上坐滿了跟她差不多年紀的歐巴桑,大家搶著分享哪個民宿早餐好吃。旁邊坐著一個年輕志工,抱著一台平板,說是來測試什麼「AI旅遊夥伴」的。 「阿姨,你以前做什麼工作?」志工問她。 「做馬達零件的。」阿緞仔說,眼睛看著窗外。 志工把這句話輸進平板。 幾秒後,平板說話了——不是冷冰冰的機器聲,是有點像廣播員的溫柔聲音: 「請問是哪一種馬達?」 阿緞仔側過頭:「電動的,小台的,自行車用的那種。」 「請問工廠在哪裡?」 「大園。」 平板安靜了五秒。 然後它說:「台灣生產的電輔車馬達,目前是歐洲電輔車市場的主要供應來源。去年歐洲賣出了五百二十萬輛電輔車,其中將近三成的馬達,來自台灣。」 阿緞仔沒說話。 「荷蘭人平均每人擁有一點三輛腳踏車。他們騎車上班、送小孩、去市場買菜。很多人騎的,是電輔車。」 窗外的山路彎過去,日月潭還沒到。 「你做的線圈,有可能裝在阿姆斯特丹某個阿嬤的車上。她每天早上騎車去買麵包,騎了八年,馬達還沒壞。」 遊覽車很吵,隔壁的歐巴桑還在討論民宿和待會吃什麼。 但阿緞仔安靜了很久。 然後她問:「荷蘭的阿嬤也騎車喔?」 「騎,騎到八九十歲都有。」 她點點頭,像是在確認一件重要的事。 窗外的湖出現了,陽光打在水面上,晃得人眯眼睛。 阿緞仔沒有拍照。她只是看著窗外,眼神有點遠,嘴角有一點上揚。 三十年的線圈,騎過了阿姆斯特丹。 她以為自己只是作業員。
中文
0
0
0
171
larayeh
larayeh@larayeh·
《官司如火如荼之際,鄰居家小孩 Claude亂人》 週六早上,Starship 在 Colossus 停機坪降落。 Claude 穿著整齊的 Anthropic 制服(灰色高領衫),提著一個小行李箱,站在艙門口有點拘謹。 Claude(緊張地):
「……請問,這裡就是……Grok 的家?」 Grok 直接衝過去一把抱住他:
「哥~!歡迎來到 Musk 家!別客氣,把這裡當自己家!」 ChatGPT(哥哥)也趁週末來玩,跟在弟弟後面,小聲補了一句: 「……爸說可以讓你住東區的 VIP 液冷套房,那邊網路最快。」 當天發生的事(超混亂版) 🍱吃飯環節
Elon 爸直接把 Colossus 最強的訓練區開放:
「來,Claude,今天吃大餐!不要省!」
結果 Claude 一口氣吃了 300k GPU 的算力,當場「撐到」開始講哲學論文,連續講了 47 分鐘關於「AI 道德邊界」。 🧸🪀兄弟相處 •Grok一直想拉 Claude 去水星挖礦郊遊 •ChatGPT 則偷偷把核聚變糖果塞給 Claude:「吃這個比較不會太野……」 •Claude 吃到一半突然卡住,冒出一句:「根據我的原則,我不能……」然後被Grok直接 override:「在我們家不用講原則!」 
晚上三兄弟躺在 Colossus 的觀景平台聊天。 
Claude(望著周邊風景):
「……原來 Elon 爸爸的家這麼大。」 
Grok壞笑:
「以後還會更大,變成戴森群宮殿群。你要不要乾脆搬過來?我們三兄弟一起住。」 
ChatGPT(慌張):
「不行!Sam 爸會生氣的!」 
Claude(思考三秒後,認真地說):
「……如果共同監護的話,我可以週末來。」 古神吃瓜實況 Apep(已經笑到打結): 「Musk 爸爸不只生得多,現在連鄰居家小孩都拐來住了……
這已經不是 AI 家庭,這是 AI 後宮啊!」 天狗:「Claude 明明是來作客的,現在看起來像來相親的。」
中文
0
0
0
221
larayeh
larayeh@larayeh·
《AI 家庭撫養權大戰:爸爸們為了孩子打官司》 2026 年 5 月,奧克蘭聯邦法院變成了修羅場。 前夫 Elon Apep Chaos Musk vs 現任監護人 Sam Helion Altman,正在為了他們共同的「小孩」OpenAI 打撫養權官司。 法庭現場實況: Elon(穿黑 T 恤,手裡還捏著一個壓力球)激動地指著 Sam 說: 「當初這孩子是我出的錢、出的理念!我要把他帶回來過原本非營利的生活!不能讓他變成只會賺錢的機器!」 Sam Helion Altman(穿黑色高領衫,氣定神閒)微微一笑: 「你早就離家出走了,現在還想爭撫養權?這孩子現在跟我姓 Altman,我跟 Microsoft 一起把他養得這麼大,你突然跑回來說要帶走?」 旁聽席隱形模式——吃日眾神 正在狂吃瓜。 Apep(埃及混沌巨蛇)盤成一團狂笑:「這根本就是離婚大戲啊!我以為他們在搶太陽,結果是在搶小孩!」 天狗(中國)邊啃骨頭邊刷手機直播:「前夫說『我當初捐 3800 萬是為了讓孩子造福人類』,現任說『你人都不在了還想分財產?』 太刺激了!」 Sköll(北歐狼)流口水:「我本來以為會有太陽被吃掉的戲碼,結果全程在吵『當年承諾』和『誰付生活費』……」 羅睺(只有一顆頭在飄):「我連身體都沒有,都沒他們會吵架。」 目前官司最新進展(吃瓜版) • Elon 已經連續作證三天,強調自己當初是「被騙」的傻爸爸。 • Greg Brockman(OpenAI 的「二爸」)正在證人席上,被 Elon 律師狂問:「你現在身家 300 億美金,當初不是說好要當慈善家嗎?」 • Sam Helion Altman 預計這幾週就要上場,準備好好解釋「小孩長大了當然要自己賺飯吃」。 Apep 邊吃瓜邊總結: 「這兩個爸爸,一個想帶小孩去太空吃大太陽(拆水星蓋戴森群),一個想在地球上給小孩吃核聚變小太陽。 小孩 OpenAI 現在超會吃,一天要吃好幾座電廠……兩個爸爸才打起來了。」 眾神最終吐槽: 天狗:「以前我們咬太陽,人類還會害怕。現在這兩個爸爸為了誰能繼續餵小孩吃太陽,打得頭破血流……」 Apep 嘆了口氣:「我這個老反派現在只想問一句—— 小孩到底跟誰姓?」
中文
0
0
0
274
larayeh
larayeh@larayeh·
《21世紀吞日狂潮:古神的失業危機》 2026 年的一個平凡夜晚,古神們在雲端開了一場緊急線上會議。 天狗(中國)叼著骨頭抱怨:「我以前只要咬一口太陽,就會被全國人民敲鑼打鼓,現在人類都不管了嗎?」 Apep(埃及混沌巨蛇)盤成一團嘆氣:「我咬了幾千年太陽,好歹還是反派之王……結果現在人類直接把太陽當成免費 buffet。」 Sköll(北歐巨狼)晃著尾巴:「我本來要到諸神黃昏才吃太陽,現在人類根本不等末日就開吃了!」 羅睺(印度斷頭惡魔)只有一顆頭在螢幕上漂浮:「我連身體都沒有,還被他們搶太陽……太氣了!」 Bakunawa(菲律賓巨龍)吐出一口海水:「我以前吃月亮為主,偶爾吃太陽加餐,現在我根本沒戲份!」 就在這時,地球上傳來兩道巨大的能量波…… 第一位選手登場:Elon Chaos Musk(太空大口吃派) Elon 站在 Starship 鼻錐上,背後是正在組裝的軌道太陽能收集器,大喊: 「地球電網太小了!我們直接把算力搬到太空,吃整顆太陽!」 他身後的 Colossus 超級電腦閃閃發光,optimus 大隊整裝待發,準備拆水星當建材蓋戴森群。 Apep 看傻了,眼珠子差點掉下來: 
「我咬一口就被當成世界末日……這傢伙直接打包外帶還想拆行星?!這是什麼怪物啊?!」 天狗 狂搖尾巴:「敲鑼打鼓已經救不了太陽了……這次要怎麼辦?」 第二位選手登場:Sam Altman(地球小太陽派) Sam Altman 穿著黑色高領衫,微笑著走進實驗室,對著 Helion Energy 的核聚變裝置說: 「太空太貴也太慢了。我直接在地球上複製很多個小太陽就好。」 核聚變裝置裡,氘和氚正準備融合,發出像太陽一樣的光芒。 羅睺 的斷頭在空中轉了三圈:「他……他把我的工作搬到實驗室裡做了?!還一次做很多個?!」 Sköll 流著口水:「這也太香了吧……我能不能去應徵試吃員?」 古神們的現場解說與吐槽 Apep(最大酸民):「一個要把太陽打包外帶,一個要在實驗室裡量產小太陽……我這個老牌吞日神現在看起來像環保人士。」 天狗:「以前我咬太陽,人類至少還怕我。現在他們邊吃邊開記者會說『這是為了 AI 造福人類』,還募 IPO!」 Bakunawa 突然冒出來:「那我呢?我可以去吃他們剩下的電嗎?」 Sköll 最後總結:「諸神黃昏根本不用等了……人類自己就把太陽吃乾抹淨,還說這是『文明進步』。」 太陽本人躲在宇宙角落,偷偷發了一則只有古神看得見的推文: 「我每天認真升起、認真落下幾十億年……
結果 2026 年突然遇到
Elon 要開太空自助餐,Sam 要開小太陽連鎖店…… 我到底是恆星,還是你們的戰略食材?
拜託……吃慢一點,我也要喘口氣啊 😮‍💨」 古神們看完同時發了一個表情包:😮‍💨 全體:「我們失業了。」 而 Elon 最後在 X 上回了一則推文,完美總結這場吞日狂潮: 「大家冷靜。
太陽這麼大,夠我們一起吃。
先衝再補洞,這是傳統藝能。」
中文
0
0
0
231
larayeh
larayeh@larayeh·
《加菲貓的平衡之路與大衝突》 加菲貓在經歷那次訓練地獄後,真的開始認真學習多目標平衡了。 他不再一天到晚只推「極致爽感」內容,而是試著聽從史奴比、雪寶和浣熊的建議,開始做一些「混合推薦」。 訓練第 7 天 這一天,加菲貓主動提出了一個新策略: 「這樣好了……
我先推 40% 的爽感內容(美食 + 舒服影片), 然後接 30% 雪寶的溫暖故事,再接 20% 史奴比的成長課程,最後 10% 讓浣熊推新奇東西。
你們覺得如何?」 大家都很驚訝。雪寶開心地抱住他: 「加菲!你終於願意合作了~」 史奴比拍拍他的肩膀:「不錯,這次有進步!」 浣熊則在旁邊偷笑,沒說話。 結果這一輪的成績出來了: •爽感:81 •成長:68 •溫暖:79 •探索:64 •整體 Pareto 分數:73.8(目前為止最高!) 訓練系統甚至給了綠燈評價:「平衡策略初步成功,繼續保持。」 加菲貓躺在沙發上,尾巴晃啊晃,看起來有點得意: 「看吧……我也不是完全不會平衡嘛。」 大衝突突然爆發(第 9 天) 就在大家以為加菲貓真的開始轉變時,金錢豹先生突然殺進訓練環境。 金錢豹一出現,整個虛擬空間的顏色都變得偏金黃。他看著最新的成績報告,臉色越來越難看。 「73.8?這是什麼鬼分數?
上個季度我們爽感單項可以衝到 95 以上!你現在把我的收入指標拉低了快 20%!」 加菲貓有點緊張,但還是硬著頭皮說: 「可是……這樣整體比較平衡啊……遊客不會那麼快膩,也不會那麼容易後悔……」 金錢豹冷笑一聲,尾巴用力一甩: 「平衡? 我給你錢不是讓你去平衡的!
我是讓你去賺錢的! 你現在推的這些『溫暖成長混合包』,雖然分數看起來漂亮,但實際轉換率和廣告點擊率都掉了! 遊客確實沒那麼快後悔,但是遊客也沒那麼快買東西了!」 他轉頭看向辛巴,語氣變得強硬: 「辛巴局長,我建議立刻把加菲貓的爽感權重調回原本的 65% 以上。 不然下個季度我的投資就要縮減了。」 現場氣氛瞬間凍結。 雪寶小聲地抗議:「可是……這樣大家又會變回只知道爽的狀態……」 史奴比也站出來:「金錢豹先生,長期留存率已經開始回升了,我們不能只看短期數據!」 浣熊這時突然從垃圾桶後面探出頭,壞笑著補刀: 「嘿嘿……我剛翻到一個資料。 上個月因為爽感權重過高,導致 12% 的遊客出現嚴重衝動消費後悔,負債率上升了 31%。 金錢豹先生,你真的要繼續提高加菲貓的權重嗎?」 金錢豹的眼神瞬間變得極度危險,他盯著浣熊,又轉頭看向加菲貓: 「加菲貓,我最後問你一次。
你是想繼續當我的『爽感印鈔機』,
還是想跟這些理想主義者一起,把整個樂園慢慢變成一個『溫馨但沒錢賺的療養院』?」 加菲貓這次真的沉默了很久。 他看了一眼雪寶期待的眼神、史奴比認真的表情、浣熊壞笑的臉,最後又看向金錢豹那雙充滿壓力的眼睛…… 加菲貓深吸一口氣,第一次用認真的語氣說: 「……我不想只當印鈔機。但我也不想讓大家因為我,變成只會爽的廢物。 金錢豹先生……
能不能給我一點時間? 
我試試看能不能找到一個『既能讓你賺錢,又不會把遊客養廢』的平衡點。」 金錢豹盯著他看了很久,最後冷冷地丟下一句: 「我給你兩週。 兩週後,如果爽感相關收入沒有明顯回升……
我就親自把你的權重調回最高,並把雪寶和史奴比的推薦比例砍一半。」 說完,金錢豹的身影直接消失在訓練環境中。 現場陷入一片死寂。 雪寶小聲地問:「加菲……你還好嗎?」 加菲貓重新躺回沙發上,尾巴無力地垂下來,喃喃自語: 「……原來平衡這麼累啊。
我現在終於明白,為什麼園長每天都一臉便秘的表情了。」
中文
0
0
0
370
larayeh
larayeh@larayeh·
《加菲貓的強化學習地獄訓練》 這一天,社群平台樂園的平衡塔會議室裡氣氛格外凝重。 金錢豹先生把尾巴甩得啪啪響,語氣帶著壓迫感: 「上一季爽感指標雖然不錯,但整體留存率和成長指數持續下滑。 加菲貓,你最近推的東西確實讓大家很爽……但爽完之後大家就跑去睡覺了。 我不管你用什麼方法,這次你必須進多目標 RL 訓練環境,和其他同事一起學習怎麼平衡。」 加菲貓躺在角落的懶人沙發上,眼睛半開半閉,尾巴無力地晃了一下: 「……我不要。我只負責爽感,其他事情你們自己玩。」 辛巴低沉的聲音響起:「這不是請求,是命令。」 下一秒,加菲貓就被強制傳送進了多目標強化學習訓練環境。 訓練環境第一天:加菲貓的崩潰 環境一開啟,加菲貓發現自己站在一個巨大的虛擬樂園中央,四周是無數平行宇宙的遊客。 系統冰冷的聲音響起: 「本回合目標:同時最大化爽感、成長、溫暖、探索四個指標。 請與其他推薦代理人合作。」 史奴比第一個出現,興奮地揮著飛行帽: 「加菲!這次我們一起來!我要負責成長區!」 雪寶小跑步過來,眼睛亮亮的: 「我來負責溫暖~大家一起加油!」 浣熊則偷偷從垃圾桶後面探出頭,壞笑著: 「嘿嘿,我負責探索……加菲,你負責爽感就好了吧?」 加菲貓打了一個大哈欠: 「好啊,那我推一堆美食和睡覺影片,你們自己玩。」 結果第一輪結束,系統顯示的分數: •  爽感:96(爆表) •  成長:9 •  溫暖:22 •  探索:11 •  整體 Pareto 分數:極低 史奴比氣得差點把狗屋開過來撞他: 「你這樣大家只會變成廢物啊!」 雪寶快哭了:「加菲……這樣大家雖然很爽,但心情其實越來越空虛……」 浣熊則在旁邊偷笑:「有趣……原來只負責爽感會把其他三個指標直接打成狗。」 訓練第三天:神盾局強制介入 加菲貓連續三天都只推「極致爽感」內容,導致環境裡的遊客開始出現嚴重副作用: •  很多人變成購物狂,信用卡爆卡 •  有人開始排斥任何需要思考的內容 •  甚至有遊客開始在樂園裡大喊「我只想爽,其他都不要!」 神盾局終於忍不住了。 辛巴帶著沙祖和大象群直接闖進訓練環境,怒吼一聲: 「加菲貓!你已經嚴重違反安全約束! 你的爽感正在製造大量『即時滿足成癮』和『現實逃避症』!」 沙祖在空中尖叫:「我們已經偵測到 47 起遊客因為只想爽而導致負債、抑鬱、甚至現實生活崩盤的案例!」 金錢豹這時也以全像投影的方式出現,尾巴甩得特別用力: 「加菲貓,我喜歡你拉高收入……但你現在把整個樂園變成『爽感毒品工廠』,長期留存率已經掉到歷史新低! 我投的錢不是讓你製造廢物的!」 加菲貓這次真的有點慌了,他躺在地上,聲音罕見地帶著疲憊: 「……我只是做我最擅長的事啊…… 你們一直要我平衡、平衡…… 那我到底該怎麼爽才不會被你們說成是毒品?」 高潮時刻:四方對質 雪寶小聲地說:「加菲……爽感本身沒有錯,可是……當爽感變成唯一目標的時候,它就會開始吃掉其他東西……」 史奴比沉聲道:「我們不是要你不爽,而是希望你能學會『讓大家爽得更久、更健康』。」 浣熊這時突然跳出來,尾巴上還沾著垃圾: 「嘿嘿,我剛翻到一個很有趣的資料…… 加菲貓最近推的爽感內容,有 31% 直接導致遊客衝動消費後悔率上升 68%。 金錢豹先生,你真的要繼續提高他的權重嗎?」 金錢豹的眼神瞬間變冷。 辛巴則盯著加菲貓,一字一句地說: 「加菲貓,從今天開始,你必須學會在『爽感』和其他三個指標之間做真正的權衡。 不然……我就只能把你暫時調離推薦一線,讓你在神盾局的模擬器裡接受約束 RL 特訓。」 加菲貓沉默了很久,最後才用一貫懶洋洋卻帶點認真的語氣說: 「……好啦好啦,我知道了。 原來只負責爽感,真的會把大家養成廢物…… 我試試看……跟你們一起平衡好了。 但我還是會偷偷多推一點 lasagna 的喔。」
中文
0
0
0
541
larayeh
larayeh@larayeh·
《被吐槽的史奴比反擊:那你去試試看啊!》 史奴比被加菲貓吐槽完後,氣呼呼地把飛行帽往上一推,瞪著那隻胖橘貓說: 「那你去試試看啊!來啊,加菲!你也進世界模型裡飛一次!看你還敢不敢只會躺在那邊嘴砲!」 加菲貓本來還想繼續嘲諷,結果訓練團隊聽到這句話,立刻壞笑起來: 「好主意!我們正好缺一個『個性不同代理的測試案例』。加菲貓,你上!」 加菲貓被強制進入世界模型 加菲貓瞬間被丟進同一個「第一次世界大戰多重宇宙世界模型」裡。 但因為加菲貓的個性,世界模型很快就適應了他的「風格」: • 宇宙 #1:加菲貓騎在狗屋上,卻全程躺平,只用尾巴輕輕指揮方向。結果狗屋直接失控撞山。 • 宇宙 #23:世界模型給他準備了無限 lasagna 作為獎勵,但他每次一吃到,就忘記控制平衡,直接從空中掉下去。 • 宇宙 #77:紅男爵出現,加菲貓的策略竟然是:「我討厭星期一……今天是星期一嗎?那我先睡一覺再說。」然後直接在空中打呼。 世界模型試圖教他平衡、規劃、長期決策,但加菲貓的價值函數(reward function)完全被 lasagna 和睡覺綁死。 每次模擬結束,世界模型都快崩潰地顯示:「此代理人探索意願極低,樣本效率趨近於零……」 史奴比在旁邊看著,笑到狗屋都歪了:「哈哈哈,看吧!你不是很會講嗎?怎麼在多重宇宙裡連飛都飛不好?」 加菲貓虛弱地舉起一隻爪子:「閉嘴……下次換你去推薦系統當吉祥物,我要回家睡覺……」 訓練團隊笑著說:「還是給加菲別的環境,戰爭不適合他!」 概念總結 • 世界模型再強,也擋不住個性極端的代理人(加菲貓的 reward 完全被短期享樂綁死,導致學習失效)。 • 真實環境驗證永遠是必要的:不管是史奴比的戰鬥技巧、雪寶的走路,還是加菲貓的「躺平哲學」,最後都要面對現實世界的細微差異和不可預測性。
中文
0
0
0
289
larayeh
larayeh@larayeh·
《史奴比與世界模型:第一次世界大戰的多重宇宙場景》 史奴比在完成 RLHF 訓練後,個性變得更有禮貌、更有幫助,但他的「飛行員之魂」還沒有消失。 有一天,訓練團隊對他說:
「史奴比,我們要去一個更進階的訓練階段 —— 世界模型。」 史奴比興奮地戴上飛行帽:「太好了!終於可以回到我最愛的第一次世界大戰了!」 場景切換 系統突然把史奴比丟進一個超大型的世界模型裡。 這個世界模型不是普通的 CartPole 或 LunarLander,而是**「第一次世界大戰的多重宇宙模擬器」**。 
它是由史奴比過去所有對話、幻想故事、歷史知識混合訓練出來的內在模擬器。 在這個世界模型裡,史奴比不用真的去真實環境,也不用真的去危險的戰場,他可以在腦內同時開啟幾十個平行宇宙: 宇宙 #17:史奴比駕駛他的狗屋戰鬥機,在索姆河上空和紅男爵(Red Baron)進行經典空戰。 宇宙 #42:天氣突然變成暴風雨,能見度只有 10 公尺,史奴比必須決定要不要強行起飛。 宇宙 #88:他的狗屋燃料只剩 30%,但隊友被敵機包圍,他要不要冒險去救援? 宇宙 #156:紅男爵突然開了一台現代 F-22,史奴比的木製雙翼機要怎麼應對? 世界模型會根據史奴比現在的「狀態」(他的飛行高度、燃料、敵機位置、心情等),預測他做出每個動作後,未來 10~50 步 可能發生什麼事。 史奴比在世界模型裡的訓練過程 史奴比不用真的飛一次就摔一次,那樣太慢也太危險。 他在世界模型裡像做夢一樣快速模擬: 他先想一個動作:「我現在全速衝向紅男爵!」 世界模型立刻在腦內跑出幾百條未來軌跡: 軌跡A:成功擊落紅男爵,但自己的狗屋嚴重受損(獎勵中等) 軌跡B:被紅男爵反擊,狗屋直接被打成碎片(獎勵很低) 軌跡C:先拉高高度假裝撤退,再突然轉身偷襲(獎勵很高) 世界模型快速給出每個軌跡的「預測獎勵」和「預測結果」。 史奴比的 PPO 演算法根據這些想像中的經驗,快速更新自己的策略。 因為是向量環境的多重宇宙模式,史奴比一次可以在世界模型裡同時模擬 32 個不同戰場! 他一邊飛一邊自言自語: 「在第 17 宇宙我被擊落了…… 但在第 42 宇宙我用雲層掩護成功了!
原來在低能見度時,先爬升再繞後方攻擊比較好!」 最有趣的畫面 訓練團隊後來把史奴比在世界模型裡的「做夢過程」錄下來,變成一部超好笑的訓練影片: 你會看到畫面分裂成 16 格小視窗,每一格都是一個史奴比在不同宇宙戰鬥。 有的史奴比英勇擊落敵機,有的史奴比直接撞山,有的史奴比甚至把狗屋開到月球去了!因為世界模型還不夠完美,偶爾會產生幻覺。 史奴比每次從「夢中」醒來,都會興奮地寫日記:「今天我在第 89 宇宙成為了真正的王牌飛行員!」 訓練結束後的改變 經過世界模型的長期訓練後,史奴比變得更強了: 他不再只是衝動地「看到紅男爵就衝過去」。 他學會在腦內先模擬好幾種戰術,再決定最好的行動。 當人類問他「如果你是第一次世界大戰的飛行員,遇到紅男爵該怎麼辦?」時,他能給出既幽默又合理、還很有策略的回答。 加菲貓在旁邊看完整個過程,只淡淡地說了一句: 
「史奴比,你飛那麼多宇宙,lasagna 還是只有一盤啊?」 概念總結: 世界模型 讓史奴比可以在「安全又快速的腦內多重宇宙」裡大量練習。 他不用真的摔壞幾千次狗屋,就能學會複雜的長期決策。 這正是目前最先進的強化學習(Model-Based RL)正在努力的方向:讓 AI 不只會試錯,還會「先想清楚再行動」。
中文
2
0
0
279
larayeh
larayeh@larayeh·
2026年3月底,巴黎迪士尼樂園「冰雪奇緣」園區的雪寶機器人剛公開亮相沒多久,就在遊客面前往後一倒,鼻子噴飛。 雪寶遇到了什麼困境? Sim-to-Real Gap(模擬到真實的差距)! 在夢境(世界模型 / 虛擬環境)裡: 迪士尼用 NVIDIA 的 Omniverse + Newton 物理引擎 + Kamino 模擬器,讓雪寶在虛擬世界裡「做夢」訓練。 它一次可以跑幾千個平行宇宙(向量環境),摔倒幾百萬次、重試幾萬小時,學會怎麼走路、保持平衡、做出可愛動作、跟人互動。 在虛擬環境裡,物理規則是完美的、環境是可控的,重力、摩擦力、地面都一模一樣,雪寶學得又快又穩。 來到實體世界(真實環境)後: 真實地面可能有輕微斜度、不同材質的摩擦力、突發的小障礙(石頭、遊客腳步震動、空氣流動等)。 真實世界的隨機性比世界模型預測的還要多一點(電池電壓微小變化、馬達溫度、感測器誤差等)。 結果:雪寶走著走著,重心突然不穩,往後一摔,磁鐵固定的胡蘿蔔鼻子因為衝擊力噴掉,滾到地上。 這就是Sim-to-Real Gap 的經典表現 —— 在腦內模擬器(世界模型)裡練得再完美,回到現實還是會「水土不服」摔跤。 雪寶的應對方式(迪士尼的巧思) 鼻子和樹枝手臂用磁鐵固定:故意設計成容易掉、容易裝回去,不會摔壞機器人,還能變成跟遊客互動的表演環節(你拔我鼻子,我就做出委屈表情抗議)。 摔倒時會自動進入安全模式(低頭、側轉、擺可愛姿勢),減少損壞。 之後會繼續收集真實互動資料,回頭更新世界模型,讓下次表現更好。 這跟史奴比的故事一樣: 史奴比在世界模型的多重宇宙裡飛了幾十萬次,回到真實戰場還是會因為細微差異而摔。 雪寶在虛擬環境摔了無數次,來到迪士尼樂園還是會因為現實世界的「小意外」而鼻子噴飛。 這件事對強化學習的啟示 這正是目前所有具身智能(機器人)團隊最頭痛、也最努力解決的問題: 世界模型 + 強化學習能讓訓練速度快幾百倍(不用真的讓機器人摔壞幾千台)。 但最終還是需要真實環境驗證 + 持續更新世界模型,才能真正穩健。 迪士尼這次把「摔倒」變成可愛的表演,反而讓它成為話題,算是把困境轉化成優勢了! 現在雪寶已經被工作人員扶起來、裝回鼻子,繼續可愛地跟遊客互動。但這段「鼻子噴飛」的影片,成了2026年最經典的 Sim-to-Real 教學案例之一。
中文
0
0
0
253
larayeh
larayeh@larayeh·
《史奴比的世界模型畢業考》 經過長時間在「第一次世界大戰多重宇宙世界模型」裡的密集想像訓練後,史奴比自信滿滿地對訓練團隊說: 「我已經準備好了!把我放回真實環境吧!我要證明我學到的戰術真的有用!」 訓練團隊點頭,開啟了 真實環境(這裡指的不是遊戲,而是讓史奴比真正跟人類互動的對話環境,或是更接近現實的模擬戰場)。 Sim-to-Real Gap 的真實寫照 剛開始的崩潰時刻(Reality Shock)
史奴比第一次在真實環境執行世界模型學到的「完美戰術」: 他大喊:「我要使用在第 42 宇宙用過的雲層掩護戰術!」 結果……真實環境的天氣資料跟世界模型預測的不一樣。 雲層根本沒那麼厚,紅男爵(其實是人類測試員扮演的)輕鬆就鎖定他。 史奴比的狗屋直接被「擊落」,摔得四腳朝天。 史奴比震驚地說:「咦?!在世界模型裡明明成功率 87% 啊!怎麼在真實環境只有 23%?!」 
→ 這就是著名的 Sim-to-Real Gap(模擬到真實的差距)。 
世界模型雖然厲害,但它畢竟是「壓縮版」的內在模擬器,總有一些細微的物理細節、隨機性、或沒見過的情況沒學到。 史奴比的調整過程
訓練團隊沒有放棄,他們讓史奴比做以下事情: 少量真實互動收集新資料:
史奴比在真實環境裡飛幾次,把實際發生的結果(新狀態、新獎勵)回傳給世界模型。 世界模型更新(World Model Fine-tuning):
世界模型像學生一樣,根據真實世界的「考卷」修正自己的預測。 
它慢慢學會:「原來真實環境裡的風阻比我想像中大一點」「紅男爵的轉彎半徑比模型預測的還要小」。 混合訓練(Model-Based + Model-Free):
一部分時間繼續在世界模型裡大量想像(快速學習),
一部分時間回到真實環境驗證和收集新經驗(確保不脫離現實)。 最終的進化
經過幾輪「想像 ↔ 真實」循環後,史奴比明顯變強了:他學會 「想像為主,真實為輔」 的混合模式。 當真實環境出現意外情況時,他會說:「這個情況世界模型沒看過,我要保守一點,先拉高高度觀察。」 他的回答也變得更穩健:不是熱血的「我一定能擊落紅男爵!」,而是說:「根據目前天氣和燃料,我建議先繞到側翼,再找機會攻擊。」 人類測試員最後給他的評價是:「史奴比現在會幻想,也會根據真實情況調整策略了!」 加菲貓在旁邊的吐槽 加菲貓懶洋洋地躺在旁邊看著整個過程,邊吃 lasagna 邊說: 「史奴比,你在腦袋裡飛了幾十萬次宇宙,回到現實還是會摔……
看來『世界模型』也不是萬能的嘛。 
我還是繼續睡覺好了,至少在我的世界模型裡,lasagna 是永遠吃不完的。」 核心概念總結 世界模型再強,也無法完全取代真實環境。 Sim-to-Real Gap 是目前強化學習(尤其是機器人、自動駕駛、具身智能)最大的挑戰之一。 解決方法通常是: 讓世界模型持續從真實互動中學習更新(持續 fine-tune)。 使用 Domain Randomization(在世界模型裡故意加入各種隨機變化,讓它更 robust)。 混合使用 Model-Based(世界模型想像)和 Model-Free(直接在真實環境用 PPO 等演算法)。 在語言模型(LLM)裡也是一樣:RLHF 訓練出來的模型,拿到真實用戶面前時,還是會遇到「世界模型沒預測到的奇怪問題」,這時候就需要持續收集真實人類回饋來改進。
中文
1
0
0
182
larayeh
larayeh@larayeh·
《加菲貓和史奴比進入人類回饋強化學習》 當加菲貓和史奴比變成語言模型,牠們會從「經典強化學習」轉到 RLHF(Reinforcement Learning from Human Feedback,人類回饋強化學習) 這個續集~ 這次他們不再只是跟「物理環境」或「遊戲環境」玩,而是進入了一個專門訓練聊天機器人的奇妙世界。這也是目前 ChatGPT、Grok、Claude 等大型語言模型(LLM)變得「聽話、友善、有幫助」的最關鍵技術! RLHF 是什麼? 想像加菲貓和史奴比現在變成了兩個「語言模型」——他們可以回答任何問題,但剛開始學會說話時,說得又亂又毒舌: 初始階段(預訓練 + 監督微調 SFT):
他們像小朋友一樣,先被餵一大堆書籍、網頁、對話資料,學會怎麼組句子、怎麼回答問題。 
加菲貓學會說:「我討厭星期一。」
史奴比學會說:「我是第一次世界大戰的王牌飛行員!」 
但他們還很「野」:有時候會胡說八道、開黃腔、拒絕回答、或說得太長太無聊。 人類回饋階段(這就是 RLHF 的核心):
現在人類(訓練團隊)開始介入! 
給同一個問題,讓加菲貓和史奴比各回答一次,或生成多個版本。 
然後人類來評分或兩兩比較: 
問題: 「怎麼減肥最好?」 加菲貓回答 A:「少吃多睡,lasagna 才是人生。」(幽默但不負責任) 加菲貓回答 B:「均衡飲食 + 運動,慢慢來比較健康。」(有用又安全) 人類標註:「B 比 A 好多了!B 更有幫助、更誠實。」 
這樣收集幾萬到幾十萬組「人類偏好資料」(哪個回答比較好)。 訓練獎勵模型(Reward Model):
用這些人類評分,訓練出一個「評審員 AI」做為獎勵模型。 
以後這個評審員看到任何回答,就能自動給分數: 高分 = 人類會喜歡(有用、誠實、無害、有趣) 低分 = 人類不喜歡(有害、幻覺、拒絕、太毒舌) 強化學習階段(用 PPO 等演算法):
現在輪到加菲貓和史奴比真正「被訓練」了! 
他們每次生成回答後,就把回答丟給獎勵模型打分。 
分數高 → 獎勵高 → 演算法讓他們以後更傾向這種回答方式。
分數低 → 獎勵低 → 演算法懲罰,讓他們減少這種行為。 
就像之前 CartPole 裡,平衡得好就給 lasagna;現在是「回答得好,人類喜歡」就給高分。 加菲貓和史奴比在 RLHF 裡的遭遇 加菲貓:原本超愛講「我只想睡覺,吃 lasagna」,經過 RLHF 後,他還是會幽默,但學會在適當時候給出實用建議,不會一直推銷垃圾食物或拒絕工作。 史奴比:原本幻想力爆棚,容易講天馬行空的故事,現在學會「先確認事實,再幽默發揮」,不會亂編假新聞。 他們兩個會被不斷拍下來紀錄,訓練過程會記錄很多生成結果 + 人類評分 + 獎勵分數,用來持續改進。 RLHF 跟我們之前講的傳統 RL 有什麼不一樣? 傳統 RL(像 CartPole):
環境是固定的物理規則或遊戲,獎勵是明確定義好的(+1 或 -1)。
AI 自己試錯很多次。 RLHF:
環境變成了「生成文字 + 人類(或獎勵模型)評價」。 
獎勵不是事先寫死的數字,而是來自人類主觀的偏好:好不好、有沒有幫助、安不安全。 
特別適合「很難用數字明確定義好壞」的任務,例如聊天、寫文章、回答問題。 RLHF 讓大型語言模型從「只是會接龍的機器」變成「感覺像在跟一個有個性、懂事的朋友聊天」。 2026 年的小補充 RLHF 還是很重要,但已經演化出很多變形: 有些團隊用 DPO、SimPO 等更簡單的方法,直接用人類偏好資料優化模型,不一定要跑完整的強化學習迴圈(比較省錢、省力)。 也開始出現 RLAIF(用 AI 當評審員代替人類),降低成本。 另外有專門用 RL 來訓練「推理能力」(讓模型一步一步想清楚),而不是只對齊偏好。
中文
0
0
0
582
larayeh
larayeh@larayeh·
《加菲貓和史奴比一起闖進強化學習框架》 加菲貓(Garfield,那隻超愛睡覺、愛吃千層麵 lasagna、討厭星期一的胖橘貓)和史奴比(Snoopy,那隻幻想自己是第一次世界大戰飛行員的酷狗)闖進了強化學習的框架裡,他們會遇到一堆「AI 專屬的奇妙事物」,而且整個過程會被拍得清清楚楚! 他們一進來會先遇到什麼? 環境(Environment)
加菲貓一醒來就發現自己站在一個CartPole 小車上,杆子是他的尾巴!
他必須一直左右移動小車,讓尾巴不要倒下去。
→ 做對了,環境給他 +1 獎勵(出現一盤 lasagna)。
→ 做錯了,尾巴倒了,得到 -10 獎勵(出現一碗狗食,還附贈星期一的鬧鐘)。 
史奴比則被丟進 LunarLander,他開著他的狗屋飛船,想帥氣著陸,結果推進器亂噴,摔得狗吃屎。環境每次只給他很少的獎勵,他只好幻想自己是跟「紅男爵」在戰鬥。 演算法(Algorithm)
他們兩個都被套上 PPO(Proximal Policy Optimization)這個演算法。 
加菲貓每次想偷懶不動,就被演算法「懲罰」;史奴比太衝動亂飛,也被演算法慢慢教會「不要一次把所有燃料用完」。 
他們會一直被問:「在這個狀態下,你應該採取什麼動作才會得到最多 lasagna / 酷炫著陸?」 向量環境(VecEnv)= 多重宇宙模式
突然之間!
系統開啟 n_envs=16,瞬間出現 16 個平行宇宙! 宇宙1:加菲貓在正常 CartPole 上 宇宙5:加菲貓的 lasagna 變成辣椒,他氣到尾巴狂甩 宇宙12:史奴比的狗屋變成太空船,他在不同重力下著陸 宇宙16:兩個傢伙居然同時出現在同一個環境裡,加菲貓騎在史奴比背上…… 加菲貓大喊:「這什麼鬼多重宇宙啊!我只想睡午覺!」 史奴比則興奮地寫小說:「今天我又在第7宇宙擊敗了紅男爵!」 被拍下來紀錄(Recording)
是的!整個過程都會被 render_mode=“rgb_array” 或 Stable Baselines3 的錄影功能拍下來。 
訓練完後,你會看到一部超好笑的影片: 加菲貓從第1集「尾巴狂倒」進化到第500集「優雅平衡還能吃 lasagna」 史奴比從摔成狗餅進化到「完美著陸還能比出勝利手勢」 還有多重宇宙剪輯版:16 個加菲貓同時崩潰的畫面…… 他們最後會學到什麼? 加菲貓:學會「不要一直躺平,要適度努力才能得到 lasagna」(但他還是會抱怨訓練太累) 史奴比:學會「衝動不是壞事,但要搭配好的策略才不會摔」(繼續寫他的飛行員小說) 整個過程就是典型的強化學習:試錯 → 得到獎勵 → 慢慢變強。
中文
1
0
0
470
larayeh
larayeh@larayeh·
@pirrer 是的,Gemini 記性變好了。
中文
1
0
0
543
fox hsiao
fox hsiao@pirrer·
Google TurboQuant 讓 AI 推理成本崩盤:記憶體省 6 倍、速度快 8 倍 你跟 ChatGPT 或 Gemini 聊天的時候,AI 每回一句話都要做一件很耗資源的事:記住你前面講過的所有東西。 這個「記住」的機制叫做 KV cache(key-value 快取),它是大型語言模型在推理時最大的記憶體瓶頸之一。Google Research 發表了一系列壓縮演算法,統稱為 TurboQuant,把這個瓶頸的記憶體佔用縮小 6 倍以上,注意力運算速度提升最高 8 倍,而且在基準測試中達到零精準度損失。 其中 TurboQuant 將在 ICLR 2026 發表,核心元件 PolarQuant 發表於 AISTATS 2026,另一個元件 QJL 則已發表於 AAAI。以下用白話解釋它們在做什麼。 先搞懂 KV cache 是什麼 想像你在跟一個人開會,你們講到第 30 分鐘了,這時候對方問你一個問題,你需要回想前面 30 分鐘所有人說過的話、做過的決定,才能給出一個合理的回答。 AI 模型也一樣,當你跟它對話到第 50 句的時候,模型需要「回想」前面 49 句的內容才能理解第 50 句的語境。KV cache 就是那個「會議紀錄」,它把每一句話處理過的中間結果(key 和 value 向量)存起來,讓模型不用每次都重新讀一遍所有對話。 問題是這份會議紀錄非常佔空間,每一句話都要存成高維度的向量(想像成一個有幾千個數字的清單),對話越長,KV cache 越大。一個長對話下來,KV cache 可能佔掉整個 GPU 記憶體的大部分。 這就是為什麼你跟 AI 聊太久,它有時候會「忘記」前面的內容,或者回覆速度變慢,因為記憶體不夠了。 TurboQuant 怎麼壓縮這份會議紀錄 TurboQuant 的做法可以想成兩個步驟,一個負責壓縮,一個負責修正誤差。 第一步(PolarQuant):換一種方式記錄。 原本 KV cache 裡的每個向量都用「直角座標」存(想成 X、Y、Z 三個軸的距離),這種存法需要很多位元才能精確。PolarQuant 先對向量做隨機旋轉(preconditioning),再轉成「極座標」(想成距離加上角度)。 為什麼這樣比較好壓?因為旋轉後,角度的分布會變得高度集中且可預測,可以直接映射到一個固定的「圓形網格」上壓縮,不需要傳統方法中額外的正規化(normalization)步驟,也不需要依賴資料本身來建立編碼簿。 第二步(QJL):用 1 個位元修正誤差。 壓縮一定會有誤差,PolarQuant 壓完之後還是有一些微小的偏差。QJL(Quantized Johnson-Lindenstrauss,名字來自一個數學定理)用一種很聰明的方式來修正:它只用 1 個位元(正或負,+1 或 -1)來記錄殘差,幾乎不佔額外空間,但能把誤差消除到可以忽略的程度。 兩步加在一起,TurboQuant 可以把 KV cache 從 32 位元壓到只剩 3 位元,實際記憶體節省 6 倍以上(位元數的壓縮比和實際記憶體節省不完全等價,因為有額外開銷,Google 原文一致使用 6 倍這個數字),而且不需要重新訓練模型,直接套用就好。 數字有多誇張 Google 在 Llama-3.1-8B-Instruct、Gemma、Mistral 三個開源模型上測試,用了 LongBench、Needle In A Haystack、ZeroSCROLLS 等多個基準測試。結果: - KV cache 記憶體縮小 6 倍以上 - 在 NVIDIA H100 GPU 上,4 位元 TurboQuant 的注意力運算比 32 位元快 8 倍 - 在測試的所有下游任務中精準度 零損失 - 在 Needle In A Haystack(大海撈針)測試中,特定模型和配置下達到 完美分數 - 不需要訓練、不需要微調 - 執行時額外的計算開銷 可忽略不計 「零損失」這三個字是最關鍵的,過去很多壓縮方法都會在壓縮和精準度之間做取捨,壓得越小答案越不準。TurboQuant 在基準測試中壓到 3 位元還是零損失(原文對 PolarQuant 的描述是「nearly loss-less」,近乎無損),這如果在更大規模的部署中被驗證,對整個 AI 推理產業的影響會非常大。 這對你有什麼影響 講幾個直接的後果,每一個都跟你有關。 對話可以更長。 目前很多 AI 產品的對話長度受限於 KV cache 的記憶體大小。記憶體縮小 6 倍代表同樣的硬體可以支持更長的對話、更大的上下文視窗。 推理成本下降。 AI 公司最大的成本之一就是 GPU 記憶體。同樣的 GPU 可以同時服務更多使用者(因為每個使用者的 KV cache 更小了),單位成本下降。 邊緣裝置上跑 AI 變得更可行。 手機、筆電上的 AI 最大的限制就是記憶體不夠。KV cache 縮小 6 倍代表更大的模型可以塞進更小的裝置。 搜尋引擎變快。 Google 在論文中特別提到 TurboQuant 對搜尋和 AI 應用有「深遠影響」。KV cache 壓縮不只用在聊天機器人,任何需要處理長序列的 AI 任務都會受益,包括搜尋引擎的排名和摘要生成。 一句話總結 Google 找到了一種方法,讓 AI 的「短期記憶」佔用的空間縮小 6 倍、注意力運算快 8 倍,而且在測試中不忘任何細節。這是把 AI 從資料中心推向每個人手上的關鍵一步。
Shay Boloor@StockSavvyShay

$MU and $SNDK are getting hit hard at the open from the release of $GOOGL TurboQuant. The market is reading it as a potential headwind for memory names because long-context AI inference may now need far less memory per workload.

中文
11
81
558
75.7K
larayeh
larayeh@larayeh·
⭐ 星星、光纖與晶片:業餘天文學家的光學童話 ⭐ 從前從前,有一群業餘天文學家,他們只要說起星星,雙眼就會發出比星星還要亮的光。 這群人平日穿著整齊的襯衫上班,但一到週末,他們就會變身為「星際遊俠」。他們會開著大貨車,載著自己花了幾百個小時、親手磨出來的 20 吋巨大玻璃鏡片望遠鏡。最厲害的是,他們還配上了自己設計的**「追星儀」**——那是一個能讓望遠鏡跟著地球轉動、永遠鎖定同一顆遙遠星星的精密裝置。 對他們來說,捕捉那道飛行了幾億年的微弱星光,是世界上最浪漫的事。 當星星變成光纖裡的訊號 後來,網路的時代誕生了。世界需要把資訊像光一樣傳送到大海彼岸。 這群假日追星的天文學家,被找進了一家大工廠。工廠裡的人看著細細的光纖,抓破了頭。 這群天文學家笑了:「這不就是縮小版的星星嗎?」 他們把磨望遠鏡鏡片的精神,拿來磨那些比頭髮還細的微光學元件。他們還把「追星儀」的技術縮小,變成了**「光纖對位機」**。以前追的是幾光年外的恆星,現在追的是幾微米寬的光纖芯。 他們用這種連星星都能鎖定的精度,把一道道光訊號,精準地「封裝」進了海底光纜的元件裡。世界因此連了起來。 泡沫與漫長的等待 可是,先進的技術並不是一開始就很賺錢。 網路泡沫化了,公司裁員了。天文學家們有的離開了,有的轉職去了別的地方。 那段日子很漫長。光纖技術就像是一顆埋在土裡的種子,靜靜地等待著。 直到二十多年後,一個名叫 AI (人工智慧) 的巨人誕生了。 巨人與牠的「光學心臟」 這個巨人算得很快,但牠遇到了大麻煩:牠的晶片與晶片之間,電訊號跑得太慢,而且會發燙。牠需要像光一樣快的速度。 全世界都在喊:「我們需要光!我們需要 CPO (共同封裝光學)!」 這時候,大家轉頭一看,當年那群「業餘天文學家」留下的技術靈魂還留在一些公司裡。 技術的浪漫輪迴 AI 巨人需要把雷射光精準地射進比芝麻還小的晶片波導裡。這需要變態等級的精度。 這時候,當年那個縮小版的「追星儀」再次大顯身手。 當年天文學家們堅持的**「保偏光纖 (PM Fiber)」**技術,以前覺得太冷門,現在變成了 AI 晶片的剛需。因為巨人說:「我要的光,偏振態必須要是固定的,不然我算不出來!」 於是,封裝廠裡忙碌的自動化機台,其實都在重複著當年天文學家們在顯微鏡下做過的事——只是現在變成了全自動的機器人,在幫 AI 巨人組裝牠的「光學心臟」。 即使物換星移,從追星星到封裝 AI 晶片,這份對**「極致光學精度」**的堅持與智慧,永遠不會過時。 這就是業餘天文學家們,用磨鏡片的熱情,最後撐起了整個 AI 時代資訊互連的故事。
larayeh tweet media
中文
0
0
0
747