chichiri

406 posts

chichiri banner
chichiri

chichiri

@todd_tsao

Katılım Ekim 2021
691 Takip Edilen71 Takipçiler
chichiri retweetledi
fox hsiao
fox hsiao@pirrer·
這是我第一次聽到 @DrJimFan 的演講,非常幽默有趣,然後我覺得有生之年大概買一台人形機器在家處理家事、幫你洗頭髮大概穩了,好好活著,各位。 在 AI 領域,我們常聽說圖靈測試(Turing Test)是衡量機器能否展現與人類無異對話能力的里程碑。如今,大型語言模型(LLM)似乎已悄悄地通過了這個測試,但大家對其突破已習以為常,甚至會因為語音助理慢了幾秒或程式碼沒被完全除錯而抱怨連連。 NVIDIA AI 研究總監、身為廣受矚目人形機器人專家 Jim Fan 指出,當前業界對 LLM 的驚人進步視為「只是又一個平常的星期二」(just yet another Tuesday),這反映了我們對文字世界 AI 的標準已大幅提高。 然而,當我們將目光轉向現實世界,讓機器人進行物理操作時,會發現挑戰巨大得多。 Jim Fan 在演講中提出了一個引人深思的概念:「物理圖靈測試 (Physical Turing Test)」。這個測試的想像情境是:如果你回家後,看到雜亂的房間被整理得乾淨俐落,甚至還準備了一頓浪漫的燭光晚餐,而你無法分辨這是由真人還是機器人完成的,那代表這個機器人通過了物理圖靈測試。 但現實呢?看看那些連站起來都困難的人形機器人,或是嘗試為主人做早餐卻搞得一團亂的機器手臂(雖然辨識出牛奶值得給 A-,但湯匙餵食的確是 VIP 等級的體驗),我們離「物理圖靈測試」還差得很遠。 實體 AI 的最大瓶頸:資料飢渴症 為什麼物理圖靈測試如此困難? Jim Fan 點出了核心問題:資料。LLM 研究人員抱怨網際網路資料快被用完,稱其為 AI 的「化石燃料」。但對機器人學家來說,我們甚至連這種「化石燃料」都沒有。真實世界的機器人資料——例如關節的精確控制訊號、連續的運動軌跡——是無法從網路上抓取的。這些資料必須透過昂貴且耗時的「遙控操作」(teleoperation)方式收集,也就是由真人穿戴感應裝置來遠端控制機器人,手把手地教它完成任務(例如從烤麵包機拿出麵包再淋上蜂蜜)。 這種方式極度沒效率,Jim Fan 將其比喻為燃燒「人類燃料」(human fuel),比化石燃料還稀缺,每天每個機器人頂多運作 24 小時,而且真人會累,機器人更容易壞。這嚴重限制了機器人學習的多樣性和規模,形成了一個巨大的資料瓶頸。 模擬世界的核能:突破資料荒的救星 要突破這個瓶頸,唯一的出路是「模擬 (Simulation)」,找到機器人學的「核能」。Jim Fan 介紹了NVIDIA為此推進的三階段模擬策略: 模擬 1.0:數位分身 (Digital Twin) 概念:在虛擬世界中建立機器人和環境的一對一精確拷貝。 方法:利用高效能的向量化物理引擎,可以在單一 GPU 上模擬上萬個環境,速度比現實世界快上萬倍。結合「領域隨機化 (Domain Randomization)」技術,在模擬時隨機改變重力、摩擦力、物體重量等參數,迫使 AI 在各種條件下都能執行任務。 優勢:極快的訓練速度。訓練出的模型可以直接零次轉移 (zero-shot) 到真實世界機器人上,無需微調。例如,訓練機械手在模擬中轉筆,訓練機器狗在球上平衡,訓練人形機器人行走(10 年訓練量在 2 小時模擬完成)。一個僅有 150 萬參數的神經網路就足以捕捉人形機器人全身平衡和敏捷動作的複雜控制。 限制:數位分身需要人工精確建模,建立複雜環境耗時費力,模擬的多樣性仍然受限於人工設定的範圍。 模擬 2.0:數位表親 (Digital Cousin) 概念:開始在模擬中引入生成式 AI。雖然不像數位分身那樣是精確拷貝,但能產生足夠多樣的環境和場景,「像數位分身的表親」。 方法:利用 3D 生成模型生成場景中的各種物品(如家具),使用擴散模型(Diffusion Model)生成紋理貼圖,利用 LLM 根據文字提示生成場景佈局的 XML 檔案。 NVIDIA 的 Robocasa 框架就是例子,可以生成大規模、包含日常任務的模擬場景,除了機器人本身,其他幾乎都是生成的。 優勢:顯著增加了環境和任務的多樣性。可以在模擬中進行遙控操作,然後將軌跡變異、擴展到更多生成的環境中,實現 N (環境數) * N (動作變異數) 的資料乘法爆炸。雖然畫面真實度可能不及真實世界,但「足夠接近」。 限制:相較於 1.0,運行速度可能較慢,仍部分依賴傳統渲染管線。 模擬 3.0 (世界模型 / 擴散模型):數位遊牧者 (Digital Nomad) 概念:直接利用生成式模型(特別是影片擴散模型)來模擬物理世界的互動,擺脫對傳統物理引擎的依賴。 方法:以大量真實世界影片(數百萬段網路影片)訓練影片擴散模型,使其學會模擬各種複雜的物理現象(如流體、軟體變形)。 NVIDIA 的研究表明,只需用真實機器人實驗室收集的少量領域特定資料微調通用的影片生成模型,就能讓模型學會模擬機器人的精確互動。 優勢:極致的多樣性。影片擴散模型能模擬任何它在訓練資料中「看過」或「想像」的互動,不受傳統物理引擎的限制(例如模擬機器人彈烏克麗麗,即便硬體不支援,模型也能「畫」出來)。 這就像讓機器人漫遊在影片模型的「夢境空間」(dream space)——一個壓縮了海量網路影片的多元宇宙,實現「萬物、處處、一時」(Everything Everywhere All at Once) 的互動學習。僅僅一年時間,影片生成模型在物理真實度上(例如變形麵條)的進步,就超越了傳統圖學 30 年的發展。 速度:目前運行可能較慢,但具備隨算力呈指數級成長的巨大潛力。 具身縮放定律與 GR00T N1 Jim Fan 總結,傳統模擬(1.0)的速度快但受限於多樣性,而生成式模擬(2.0/3.0)雖可能起步慢但能隨算力呈指數級擴展其多樣性。這兩種模擬方式的結合,將是為下一代機器人系統提供龐大訓練資料的「核能」。這也意味著,對 AI 算力的需求只會越來越大,那些認為算力問題會迎刃而解的人需要再三思考。 藉由這些模擬技術產生的海量資料,NVIDIA 開發了「視覺語言行動模型 (Vision Language Action Model, VLA)」,能接收圖像和語言指令,並直接輸出機器人的運動控制訊號。今年 GTC 大會上黃仁勳發表的 GR00T N1 模型就是一個實例,它能在真實世界執行抓取香檳、工廠零件甚至多機器人協調等任務。 GR00T N1 已開源,NVIDIA 也計劃將未來的模型開源,以普及「實體 AI」。 物理 API:通往新世界的入口 實體 AI 的最終目標,是實現「物理 API (Physical API)」。想像一下,就像 LLM API 讓軟體能夠操作數位世界的位元 (bits) 一樣,物理 API 將賦予軟體操作現實世界的原子 (atoms) 的能力。透過這個 API,你可以讓軟體直接控制物理致動器,改變物理世界的狀態。 這將催生全新的經濟模式和應用場景: 物理提示 (Physical Prompting):不再只用文字,而是結合視覺和語言等方式更直觀地教導和指示機器人。 物理應用商店和技能經濟 (Physical App Store & Skill Economy):米其林大廚不必親自下廚,他可以「教導」機器人他的獨家烹飪技巧,並將這個技能作為服務販售,讓任何擁有機器人的家庭都能享受到米其林級的晚餐。 Jim Fan 引用黃仁勳的話再次強調,未來「每一個會移動的東西都將是自主的」。總有一天,你回家會看到乾淨的沙發和燭光晚餐,伴侶對你微笑而不是責備你沒做家事——而那一天,我們通過物理圖靈測試的時刻,很可能就像 LLM 通過圖靈測試一樣,在世人眼中「只是又一個星期二」。這正是驅動 Jim Fan 和團隊每天努力的動力。
中文
8
61
364
19.3K
chichiri retweetledi
Intl Econ Observe
Intl Econ Observe@IEObserve·
Palmer Luckey 的TED演講,很明確地用台海戰爭來演示美中軍事對抗遇到的問題,軍工新創 Anduril 打算用什麼方法解決這個問題。 #可怕的戰爭假設情境 Palmer Luckey以一個令人不安的假設情境開場: 「在台灣遭受大規模突襲的最初幾小時,中國釋放了它的全部武器庫。彈道飛彈雨點般落在關鍵軍事設施上,在台灣能夠發射第一槍之前,就已經摧毀了空軍基地和指揮中心。」 在這個情境中,美國嘗試回應,但很快發現自己能力不足: 「我們沒有足夠的武器,沒有足夠的平台來攜帶這些武器。美國軍艦,太慢且太少,在反艦飛彈群的攻擊下沉入太平洋底部。美國僅用了八天就耗盡了精確彈藥的淺薄庫存。台灣在幾週內淪陷。」 #台灣的全球戰略地位 Luckey強調了台灣在全球半導體供應鏈中的關鍵地位: 「台灣是世界晶片供應無可爭議的中心,生產了超過90%的最先進半導體:驅動今日AI、GPU和機器人技術的高效能晶片。如果這些工廠被佔領或摧毀,全球經濟將在一夜之間崩潰。數十兆美元的損失,供應鏈陷入混亂,這將是一個世紀以來最嚴重的經濟蕭條。」 除了經濟層面,還存在意識形態威脅: 「中國是一個專制國家。在中國決定國際秩序條件的世界裡,個人自由會逐漸侵蝕,威權主義擴散,較小的國家被迫屈服。」 #國防產業的創新困境 Luckey批評了國防產業的創新停滯:「儘管我們周圍發生著令人難以置信的技術進步,但我們的國防部門卻停留在過去。最大的國防承包商已經停止了像以前那樣快速創新,優先考慮股東分紅而非先進能力。」 他指出了矽谷與國防部門之間的脫節:「矽谷已經背棄了國防部門和整個軍事界,將中國視為唯一值得迎合的經濟體或政府。曾經與軍方合作的科技公司已經決定國家安全是別人的問題。」 結果是民用技術遠超軍事應用:「你的Tesla擁有比任何美國飛機更好的AI。你的Roomba擁有比五角大廈大多數武器系統更好的自主性。而你的Snapchat濾鏡,它們依賴的電腦視覺比我們最先進的軍事感測器更好。」 #Anduril的創新方法 面對這些挑戰,Luckey創立了Anduril公司:「我創立了一家名為Anduril的公司。不是國防承包商,而是國防產品公司。我們用我們自己的資金建造有效的國防產品,而不是要求納稅人來買單。」 Anduril的核心是一個名為Lattice的AI平台:「它讓我們能夠部署數百萬個武器,而不必冒數百萬人生命危險。它還允許我們以程式碼的速度更新這些武器,確保我們始終領先於新興和反應性威脅。」 與傳統承包商不同,Anduril設計硬體是為了大規模生產: 「我們在幾個月內建造、測試和部署我們的產品,而不是幾年。這種方法使我們能夠在不到八年的時間內,為美國空軍建造自主戰鬥機,為澳大利亞海軍建造校車大小的自主潛艇,以及增強現實頭盔。」 #和平與威懾的辯證關係 儘管Anduril製造武器,但Luckey強調:「我們的核心是促進和平。我們通過確保我們的對手知道他們無法競爭來阻止衝突。普丁入侵烏克蘭是因為他相信他可以贏。國家只有在對誰會是勝利者有分歧時才會開戰。這就是威懾的全部意義。」 #軍事力量的新範式 面對中國的數量優勢,Luckey認為美國需要質的突破:「今天,中國擁有世界上最大的海軍,其造船能力是美國的232倍;世界上最大的海岸警衛隊;世界上最大的常備地面部隊;以及世界上最大的飛彈庫存,而且生產能力每天都在增長。」 他強調美國需要的不是相同的更多系統,而是根本不同的能力:「我們需要自主系統,可以增強我們現有的有人駕駛艦隊。我們需要智慧平台,可以在人類駕駛系統根本無法操作的爭議環境中運作。我們需要可以大規模生產、快速部署和持續更新的武器。」 #AI在國防中的關鍵作用 Luckey強調AI的重要性:「AI是我們能夠趕上中國數量優勢的唯一可能方式。我們不想像他們那樣將數百萬人投入戰鬥。我們做不到,我們也不應該這樣做。AI軟體使我們能夠建立一種不同類型的部隊,這種部隊不受成本或複雜性或人口或人力的限制,而是由適應性、規模和製造速度決定的。」 關於AI在戰爭中的倫理考量:「如果美國不在這個領域領導,威權政權就會領導。而他們不會關心我們的倫理規範。AI增強了決策。它提高了精確度。它減少了附帶損害。希望它能夠完全消除一些衝突。」 #自主系統的威懾力量 演講最後,Luckey提出了一個更為樂觀的台灣防禦情境:「這次,回應是瞬間的。一支由AI驅動的自主無人機隊,已經由盟友部署在該地區,在幾秒鐘內發射。它們以協調攻擊的方式群體行動,在中國轟炸機和巡航飛彈到達台灣之前就攔截了它們。」 「在太平洋,一支分散的無人潛艇部隊、隱形無人戰艦和自主飛機與有人系統一起工作,從不可預測的位置發動攻擊。我們的AI駕駛戰鬥機群與中國飛機進行空戰,反應速度比任何人類都快。」 「通過大規模部署自主系統,我們向我們的對手證明我們有能力獲勝。這就是我們如何重新獲得威懾力量。」
Intl Econ Observe tweet media
中文
9
23
258
14.2K
chichiri retweetledi
guanaco
guanaco@stefwynendaele·
Meridian's perception is too often impacted by its vast diversity and the subsequent wide spectrum when it comes to 'floor' to 'grail' pieces. I hate these definitions, but it's what most understand. Collectors look at a few listings and form an opinion based on thumbnails and mobile screens. To truly appreciate @mattdesl's work—and surely many others—I feel you have to gaze at his art either in a very large size (printed), at an extremely high resolution (as tech catches up), or by reading through one of his books to learn more about each aspect of the code and the context in which it lives. I guess this is always the case with an art form like this, but it shows that even within a digital environment, we tend to be very limited by physical concepts. Which is why I really tend to be a 'print guy' -- as my friend @rudxane1 surely knows. Over the years, this collection has both gathered attention and remained in the background, resulting in an extremely low velocity collection. It's truly held by collectors from the old days who see it as a must-have, locked away in their digital vaults. The last few months, a bunch of really great pieces have exchanged hands—the most notable for me personally being #614, owned by @zhang_matt. I even tried to get a bid on it. Failed. I am in the process of getting a second one printed... but I keep checking in daily to see what new listings are popping up. Just like the diversity of the collection, I believe its 'value' (whatever that means) will have an incredibly binary outcome in the decades to come—both marked by beauty, memories, and zero regrets in my book. For those who feel like finally picking up a Meridian, of the handful listed, the following three are real opportunities in my book—especially the charcoal one from @balon_art. If you have a great print and frame inspiration -- please share in the comments. Probably have seen the majority, but would love to discover more. If you appreciate getting inspired on a weekly basis, give a follow to @buffetlunches who matches them to nature, photography. Not sure if this is still ongoing, but have been really enjoying these posts. Allright, Sunday stroll over. #162 #985 #638
guanaco tweet mediaguanaco tweet mediaguanaco tweet mediaguanaco tweet media
English
13
10
111
5.1K
chichiri retweetledi
とうしし
とうしし@MilkyAround·
試合後に台湾代表がマウンドに集まってお辞儀して礼をする光景、2013年WBCでの日本vs.台湾の試合を思い出して感動した。 プレミア12&A代表での国際大会初優勝、本当におめでとうございます #プレミア12 #Premier12 #日台友好
とうしし tweet media
日本語
310
3.7K
43.1K
875.1K
chichiri retweetledi
Sean Ho
Sean Ho@okok07531·
おめでとう台湾!優勝おめでとうございます!大会ではシャンパンを噴射することが許可されましたが、台湾の監督はそれを丁寧に断りました。彼は「ここは日本プロ野球の場です」と言いました。この謙虚さと尊重の姿勢が本当に素敵です🇹🇼 #プレミア12 #Premier12 #TeamTaiwan
Sean Ho tweet media
日本語
712
7.6K
69.8K
11.6M
chichiri retweetledi
IsmaHelio
IsmaHelio@ismahelios·
Good morning. Lets start the day with some generative art 🤗
IsmaHelio tweet media
English
1
2
15
502
Kumamon
Kumamon@Kumamontw·
真的很榮幸被邀請做內訓演講🙏 準備期間其實很緊張,因為知道聽講者都是市場上的狠角色之一,但挑戰來了就是面對,是身為市場玩家之一的素養! 希望你們都有收穫🥹 由於這件重要的事情忙完了,近期會規劃一集podcast聊聊2023的收穫 主題會是延續上一次的我眼中的動能交易與我如何使用因子概念!
Kumamon tweet media
中文
3
0
58
15K
chichiri retweetledi
Art Blocks
Art Blocks@artblocks_io·
💐 Celebrating two years of Chimera by @mpkoz on Art Blocks! Chimera is more than art; "Chimera is a mutation, its genetics a merging of past and present."
GIF
English
7
11
87
5.9K
chichiri retweetledi
Michael Kozlowski
Michael Kozlowski@mpkoz·
Chimera released two years ago today! This collection (and it’s collectors) changed my life. It became the foundation of my career as an artist and introduced me to a world of new friends and role models. HBD Chimera! And thank you. 💐🍾
GIF
English
35
28
283
9.7K
chichiri retweetledi
Ad Professor
Ad Professor@The_AdProfessor·
23 ad copy examples I collected this year: 1. Fiverr
Ad Professor tweet media
English
23
251
2.6K
765.6K
chichiri retweetledi
Le Random
Le Random@lerandomart·
We are thrilled to announce Influentia, an exhibition in collaboration with @VolumeDAO + @AkaswapCom in Taipei! The exhibition opens today and will run until January 7, 2024. Let’s take a deeper look into what exactly is being showcased. A 🧵...
Le Random tweet media
English
11
69
108
16.4K
chichiri retweetledi
Che-Yu Wu
Che-Yu Wu@cheyuwu345·
The Soul of Flowers (20tez/200/ @fx_hash_ ) Each bloom, a digital mirage, mirrors the complexity of human perception, capturing the myriad souls in its petals. Here, flowers are not merely seen; they are felt, as they embody the diverse essences of life. fxhash.xyz/generative/slu…
Che-Yu Wu tweet mediaChe-Yu Wu tweet mediaChe-Yu Wu tweet mediaChe-Yu Wu tweet media
Taipei City, Taiwan 🇹🇼 English
7
12
62
4.1K
chichiri retweetledi
Wen
Wen@wein_liny·
Blackhole in #WebXR
English
12
64
618
46.1K