David YC Tseng ⚡️

2.1K posts

David YC Tseng ⚡️ banner
David YC Tseng ⚡️

David YC Tseng ⚡️

@davidyctseng

Co-founder of @LootexIO. Crafting products that people love to engage with. Experimenting with AI, Data, and Web3.

Katılım Eylül 2013
3.2K Takip Edilen1.1K Takipçiler
Sabitlenmiş Tweet
David YC Tseng ⚡️
David YC Tseng ⚡️@davidyctseng·
【從 ChatGPT 到 Agentic】 沒有好的文筆,也不是 AI 專家,主要是我的學習筆記讓 ChatGPT-o1 撰寫後潤飾的,只希望對你/妳學習上有所助益。 以下是一篇結合了網路上一些參考,涵蓋了從 AI 模型、系統串接,到「ReAct」方法,以及何時應該選寫簡單的程式,或是更 Agentic 的做法 1️⃣ 前言 在過去的一年中,ChatGPT 已經徹底改變我們對 AI 的想像。隨著我們進入 2025 年,焦點漸漸不再只是單一的 LLM,而是轉向更模組化的系統,最終走向能夠做更多事情的 AI agents。本文將探討以下議題: 為何串接系統(如 Retrieval-Augmented Generation, RAG)如此重要 🔵 什麼叫做讓 AI 不只「推理」,還能進一步「行動」 🔵 ReAct(Reason + Act)方法如何成為 AI 代理的核心 🔵 何時該寫簡單的程式,何時該用 Agentic 的做法來應對複雜任務 2️⃣ 早期階段 ChatGPT 的使用 ChatGPT的使用方式相當直接 🔵 輸入問題 → ChatGPT → 輸出答案 或是在需要整合外部知識時,可能會採用 🔵 輸入問題 → 搜尋 → LLM → 輸出答案 這樣的方式對於一般的問答任務或基礎需求已經足夠,但它也有明顯的侷限: 🔵 知識有限:如果不頻繁重新訓練,模型知識會過時 🔵 難以適應:單一模型無法輕易轉換到新任務或動態需求 3️⃣ 串接而成的系統 為了克服上述限制,AI 社群開始打造複合式的系統,也常被稱為 RAG(Retrieval-Augmented Generation)。在這種架構下,你會將整個 AI 流程分成專門的元件: 🔵 檢索(Retrieval):查詢知識庫或資料庫 🔵 推理(Reasoning):利用(通常是 LLM)解讀檢索到的資料 🔵 執行(Acting):根據推理結果執行相應的動作,或產生最終答案 透過將問題拆解到不同的元件中,團隊就能在不重新訓練整個系統的情況下,升級或替換任何一個元件。這不僅更容易適應,也能確保知識不斷更新。 4️⃣ 進入 AI Agent:Reason、Act 和 Memory AI Agent 更進一步帶來了自主性(autonomy)——它不只是輸出答案,還能: 🔵 推理(Reason):用大型語言模型多步驟思考與規劃。 🔵 行動(Act):呼叫外部工具,如搜尋引擎、計算器,甚至執行程式碼。 🔵 存取記憶(Access Memory):從資料庫或其他資源中讀取專門或情境化資訊。 換句話說,AI 代理能觀察自己行動的結果,反覆微調自己的計畫,並持續優化,直到得到完善的解決方案。 5️⃣ ReAct 方法 描述 AI 代理運作邏輯時,常聽到「ReAct」這個縮寫。實際流程是: 🔵 Re(Reason):AI 決定要如何規劃任務、需要哪些工具或資料來源 🔵 Act:代理執行這些動作(查詢資料、計算、程式碼執行等),然後根據結果進行觀察、調整,並決定下一步 這個循環可以在複雜任務中重複多次,不同於一次性向 LLM 提問就產生答案的作法。 6️⃣ 快思與慢思的自主性 在此結合了人類與 AI 的決策模式 🔵 務實(人類)- 快思(Think FAST):人類擅長快速的直覺判斷 🔵 代理(LLMs)- 慢思(Think SLOW)基於 LLM 的代理可以較系統、逐步地搜尋大量資料,並全面評估潛在解答 這種雙重機制能在面對簡單任務時維持高效率(人類的快速判斷),同時在複雜任務上藉由 AI 的「慢思」來進行深入而全面的分析。系統因而擁有更高的自主性,可依需求將不同類型的任務交給最適合的決策者。 7️⃣ 簡單任務 vs. 複雜任務 對於簡單、規格明確的任務——例如定期生成報表、單純計算、或一次性的網頁爬蟲——只需使用條件式(if-then)或固定指令的程式化方法就可以,所以: 🔵 低度不確定性 🔵 解法步驟大致固定 🔵 不太需要反覆迭代或多次決策 此時,傳統「寫程式」的方法往往更直接並節省資源。Agentic 要面對複雜任務,比較適合當一個任務包含多步驟、動態資訊或不確定需求時,就需要引入AI Agent: 🔵 計畫 / 思考(Plan / Think):提出假設或解決路徑 🔵 行動(Act):代理呼叫各種外部工具或 API 🔵 觀察(Observe):評估執行成果是否符合期望 🔵 迭代(Iterate):若結果不理想,就重新調整計畫,再次行動,直到取得理想結果 對於這類動態需求,Agentic AI 能進行探索並在過程中修正,而不是一個指令就把事情做死。 8️⃣ 代理式方法的優勢 🔵 適用於複雜需求:例如整合機票、天氣、活動資訊來規劃完整行程,或大規模的資料分析、偵錯。 🔵 具備適應力:能在發現新訊息或情況變動時迅速轉向或修正策略。 🔵 迭代能力:代理可以在每個階段都重新推理,比一次性作答更能避免錯誤。 🔵 結合人類協作:人類的「快思」判斷與 AI 的「慢思」分析聯合運作,可產生更全面的決策品質。 9️⃣ 如何設計你的 AI Agent 🔵 從簡單開始:如果任務相對明確,先用程式化方法 🔵 模組化:在複雜度漸增時,引入檢索、推理、與行動的模組 🔵 啟用 ReAct:讓 AI 能夠計畫、行動並反覆調整,而非一次性產生答案 🔵 保有人類參與:人類用直覺快速決策,AI 代理則做系統性推理,協力完成任務 🔟 除了 ReAct 還有哪些進階方法? 🔵 Chain-of-Thought(CoT):讓模型在回答之前,先把思考步驟一條條寫出來,不只幫助我們了解 AI 怎麼想,也能在需要時修正或調整它的推理過程。 🔵 Tree-of-Thoughts(ToT) 同時走好幾條路,看看哪條路能走到好結果。會不斷比較不同解法,像樹狀結構一樣,有些路不好就「剪掉」,最後保留最可行、效果最好的路徑。非常適合高度不確定或多步驟的複雜任務。 這兩種方法都能與 ReAct 結合,也能單獨運用在需要更強推理能力的場景。 ✅ 結論 2025 年之後,正式進入 AI 代理 時代——「ReAct」或各種自主性成為關鍵,系統透過不斷的推理與行動循環來進行最佳化。 . 從單一 LLM 到 Agentic 的演進,產品已經對 AI 能力逐漸加深的理解:AI 不只是回答問題,還能夠計畫、觀察、並動態調整。對於較不變的重複性任務,簡單的程式化方法依舊有效;但面對複雜、多層次的挑戰,AI Agents 將帶來更具創造力、迭代性與適應性的解方。 . 無論你是開發者、PM、或純粹對科技充滿好奇的人,辨別何時該用簡單方法、何時該採取代理路線,都是打造靈活產品的關鍵。將人類「快思」與 AI「慢思」結合,AI 就不再只是被動回答,而能成為一個能夠「思考」並且「行動」的夥伴,為各種應用場景開啟無限可能! 歡迎交流(打臉)、分享或加入稍後閱讀
中文
0
1
7
910
David YC Tseng ⚡️
David YC Tseng ⚡️@davidyctseng·
這是我看完 YC W26 後,最強烈的 18 個心得。 1/ 軟體公司越來越像服務業。 最後都要回到一件事:幫某個人、某個角色、某個組織,把一件麻煩的事做得更便宜、更快、更準。 2/ 未來的新創,不一定是靠更大的團隊取勝。 而是靠更高的「人均槓桿」取勝。 這一批 YC 給我的感覺很明確: 沒有大餅,極度務實。 3/ 創業不再只是比誰融資多、誰招人快、誰故事講得大。 它越來越像是: 一個極小的團隊,找到一個極具體、極痛、有人願意付錢的問題,再用 AI、軟體、自動化、分發能力,把每個人的產能放大 N 倍。 以前我們問: 這家公司是 SaaS、電商、社群、遊戲、fintech,還是 healthcare? 現在更該問: 它解決的是什麼 workflow? 替誰省時間? 替誰降低錯誤? 替誰創造可衡量的 ROI? 4/ 我相信 AI 但不是那種「只要有 AI,世界就會自動變好」的樂觀。 我比較相信的是務實的進步: 把很無聊、很痛、很低效、很難協調的事,一點一點變得更便宜、更快、更準、更容易使用。 真正改變世界的東西,很多時候一開始都不性感。 不是: 我要顛覆全人類。 我要做下一代超級平台。 我要重新定義企業工作。 而是: 我幫診所少接 30% 重複電話。 我幫建築估價師少花 10 小時整理報價。 5/ 平台幾乎都不是一開始喊出來的 平台通常是從一個專精 workflow、一個場景、一個部門、一個高頻需求裡長出來的。 所以才說:軟體公司越來越像服務業。 6/ 我覺得 YC 這批偏好的公司,有幾個共同點: 團隊很小 問題很具體 客戶很清楚 價值可以被量化 AI 是工具,不是故事 先吃下一段 workflow,而不是先喊平台 7/ 尤其重要的是:創辦人本身的密度變得極高。 以前 seed stage 可能要湊齊工程、設計、產品、BD、客服、營運,才跑得動一個 B2B 產品。 現在,兩三個很強的 founder,就能先跑出以前一個小團隊的產出 8/ 這不是說人不重要。 剛好相反。工具越強,人越重要。 同樣一套 AI 工具,放在不同人手上,結果會完全不同。 沒有判斷力的人,用 AI 會做出更多垃圾。 有產業洞察、有產品感、有執行力的人,用 AI 會變成一個小型軍隊。 這就是人均槓桿。 AI 不是讓普通想法自動變成好生意。 AI 是讓真正懂問題的人,跑得更快。 9/ 很多人討論 AI 創業時,會陷入兩種極端: 過度樂觀:包一層 AI,就能成功。 過度悲觀:AI 太容易複製,所以沒有護城河。 我覺得兩種都不對 AI 本身不是護城河。 但 AI 讓你進入某些 workflow 的速度變快了。 真正的護城河,可能來自: 客戶痛點的精準度 是否嵌進日常流程 資料和反饋速度 產業場景理解 能不能交付 outcome,而不是 dashboard 10/ 以前 SaaS 很多是在做記錄系統 CRM 記錄銷售 ERP 記錄資源 HR 系統記錄人 會計系統記錄帳 專案管理工具記錄任務 但 AI-native 的新一代產品,不應該只是記 它更應該執行 舊 SaaS 問的是: 你要不要用我的工具管理流程? 新 AI SaaS 問的是: 這段流程我能不能直接幫你做掉? 這會讓很多看似無聊的垂直場景,重新變得性感。 11/ B2B 仍是主旋律。 consumer 當然還是會有巨大機會。 但 consumer app 的問題是 distribution 太貴了。 做出一個 app 不難。 難的是讓人下載、留下來、每天用,最後還願意付錢。 B2B 雖然銷售慢、導入複雜、客戶難搞。 但它有一件迷人的事: 只要你真的幫客戶省錢、賺錢、減少風險、提高效率,客戶就有理由付錢。 製造業、零組件、醫療、診所、會計、法務、建築、工程、物流、外貿、電商後台、連鎖零售、教育、保險、工廠管理。這些產業不一定追 AI buzzword。 但每天都在處理真問題。 很多真問題都藏在這裡:LINE、Excel、PDF、Email、ERP、紙本,還有人的腦袋裡。 報價很慢 文件很多 溝通很碎 資料分散 新人訓練困難 老師傅經驗無法複製 這些都是軟體和 AI 可以切入的地方 12/ 而且你不一定要一開始就做偉大的平台。 只需要: 一個很窄的工具 服務一種角色 先吃掉一段流程 讓一個老闆覺得「這個真的有用」 讓一個團隊願意每個月付錢 13/ 創業門檻下降,不代表競爭下降。 做出產品變容易,不代表做出有人要的產品變容易 AI 讓每個人更快,不代表每個人都更有方向 工具越強,判斷力越稀缺 14/ 所以未來創業者最重要的能 不是會不會用 AI。這會變成基本功。 更重要的是: 能不能選對問題 能不能貼近客戶 能不能快速驗證 能不能忍受無聊 能不能把工具轉化成實際交付 15/ 也不要把小團隊浪漫化 小團隊不是比較輕鬆 小團隊其實更殘酷 因為沒有地方可以躲 大團隊裡,低效率容易被流程掩蓋 小團隊裡,每個人的產能、判斷、速度 抗壓性都會被放大 所以小團隊要成功,前提不是人少。而是密度高。 每個人都能獨立推進 每個人都靠近客戶或產品 每個人都能用工具放大自己 每個人都能面對不確定性 每個人都知道自己不是在完成任務,而是在推進生意 16/ 這也是為什麼未來 founder 的要求會變高。 不是每個人都要會寫 code。 不是每個人都要是 AI expert。 但每個 founder 都要懂得使用槓桿,知道 AI 可以在哪裡創造價值,哪裡只是裝飾和雜訊。 17/ 未來比的不是誰的故事更大 是誰能用更小的團隊, 解決更真實的問題,創造更高的人均槓桿。 不是 AI 讓創業變簡單。 是讓真正懂問題的人,終於有機會跑得更快。 18 /我越來越覺得,創業的主流姿態正在改變。 它可能會長得更安靜: 團隊更小 問題更具體 客戶更清楚 流程更深入 收錢更早 離真實世界更近 也更像服務業。
David YC Tseng ⚡️ tweet mediaDavid YC Tseng ⚡️ tweet media
中文
0
0
2
36
David YC Tseng ⚡️
David YC Tseng ⚡️@davidyctseng·
Claude Design 將你升級成 10 倍設計師時代即將來臨 我分別在不同時期用過 Pencil、Figma AI、Canvas、v0、Bolt,但 Claude Design 讓我重新再被驚艷一次,以下是我的心得: #產品生命週期全覆蓋 1/ 他可以做 UI wireframe、brand guideline、logo 設計、簡報,在產品生命週期的前、中、後期都有可以發揮的空間。Anthropic 自家設計師 Ryan Mather 一人負責 7 個產品線,他的工作流程是:花一小時把代碼庫、設計稿、品牌素材全塞給 Claude,讓它抽出一份 UI Kit,之後每個專案都吃這套系統自動保持一致。 你想完、畫完後的下一步,就是直接交給 Claude Code 實作正式上線可用版。 因此 Anthropic 的野心絕對不止是做 Figma 的類似產品,進一步做到從想法到產品上線的整條 Design 生產線。Claude Design + Claude Code 可以合體連續技,這產品甚至是 Claude Code 的上游產品。老實說我最近比較少用 Claude Code 了 ,因為我發現我遇到了一些瓶頸⋯⋯然後這些瓶頸,Claude Design 可以解決。 
#把老闆威能放大到極限 Tweak 功能 2/ Claude Design 強的是陪你一起嘗試的過程,tweaks 這功能可以讓你東調西調。可以體驗非常多設計上主觀的判斷決策,把老闆的威能放大到最大體感。 這就像是一個情境:設計師提案時,無論要往風格 A、風格 B 還是風格 C 的方向走,除非相當有經驗且有主見的老闆會非常知道自己要什麼(極少數),慣老闆通常習慣我全都要,每種風格全部都做一次,Claude Design 會沒有怨言的照做,幾分鐘就做好,再利用右下角的控制介面隨時切換 ABC 三種風格,來看看老闆的感覺。 這不是偶然的功能。Claude Design 的系統提示詞洩漏後,大家發現 Anthropic 明確在 prompt 裡寫了兩件事: 1/ 鼓勵多方案探索(不要一次給定案,要給選項) 2/ 明確反 AI 味(避開某些字體,避開紫色漸層,避開可預測 layout) 所以你體感到的它會陪我探索,其實是一種設計哲學。 過去用 v0、Bolt 最大的痛點是:你下一個 prompt,它出一個版本,要換版本就要再下一個 prompt。Claude Design 把探索當成一個技能,你基本上是在感受整個設計流程,是我觀察到的主要差異。 #給新手的設計鷹架 Quick Question 與 Decide for Me Quick question 有能力反問一些你自己可能都還沒想過或講清楚的需求。甚至如果你不知道怎麼回答(沒那麼 Opinionated),還可以選 Decide for me。 這邊的意思是說,其實如果你經驗不多,你根本就不知道該下什麼樣的 prompt 或給怎樣的指令;可是當他資訊不足的時候,他就會主動詢問你,所以在過程中能慢慢把你的想法更具體化地呈現出來,而不是在執行時給出太模稜兩可的意見。 這對應的是最近火紅的 Harness Engineering 思維:不要給使用者一個空白的 prompt 欄位,要給鷹架(scaffold)、要有回饋迴圈、要有 fallback。 v0、Lovable 的對話式 AI 基本上吃什麼吐什麼,不反問。Claude Design 在把缺經驗的人也變成可以產出設計的使用者,這是關鍵的設計思維。 #Director Mode 的 comment 累積 你可以在畫面中點選要給意見的地方留下 comment,等你累積好十個以上的意見後一次送出,它就能一次修改完成並回覆新的版本,做到一次改進多個你的意見! 這個功能把 AI 互動從一來一往升級成批次意見處理,跟真實的工作流程比較接近。Claude Design 的 batch comment 讓你進入產品總監模式——像真正的設計總監在看下屬交付,圈一圈寫十個 feedback,然後一次丟回去要求迭代並盡快交出完成品。 (btw Anthropic 自己承認 inline comments 偶爾會在 Claude 讀取前消失,workaround 是把 comment 貼到 chat 裡。)
 #其他觀點 上面四點是我週末用完直覺被震撼的地方。但在轉貼之前,我也翻了英文圈,發現一個很有趣的落差——英文圈資深設計師的反應卻是冷靜甚至反駁的。我同時也收集主流的反對意見: #觀點1 同質化是功能,不是 bug HackerNews 上最高票評論:「如果我在幫醫院律師蓋內部工具,我要最熟悉、最明顯的 UI。」不是所有場景都需要獨特設計。企業內部工具、醫療、金融——這些地方「一致性」比「驚艷感」重要。這個議題我很久以前就辯論過,原則上我同意上面的說法。Claude Design 輸出 Competent but Predictable 設計,反而正好打中這塊不需要太依賴設計的市場。 #觀點2 25 年資深設計師用吃角子老虎比喻 這跟我上一篇文章很像。「這是一台不會中獎的吃角子老虎。」論點是 AI design 工具看起來每次都給你可能有驚喜的感覺,但真正的 taste 像中獎一樣罕見。95% 的 AI 輸出都是 generic(泛泛之輩的作品),只有 5% 有驚喜——這個命中率跟自己從頭畫差不多。 #觀點3 美學 ≠ 設計 真正的設計工作不是美學,是資訊層級、視覺溝通、認知清晰度。Claude Design 在美學層做得不錯,但 UX 策略(user research、IA、interaction design、usability testing)完全不在這個工具的範圍裡。 #觀點4 中間層會崩潰 AI design 工具真正消滅的不是頂級也不是底層設計師,是中間層——那些做一般商業網站的「執行型」設計師。市場會分化成: 1/ 廉價:大量的 AI 泛泛之輩的設計 2/ 頂級:設計總監的品味設計 3/ 中間這層消失 #10x設計師時代到底是什麼意思 把自己的觀察跟英文圈的冷靜論點放一起整理,我的判斷是——真的 10x 的是人,不是設計師這個職位,是有 taste 但缺執行力的人: - 有 Product Sense 但不會 Figma 的 PM - 知道要什麼但請不起設計師的創業者 - 一人團隊、需要做整套品牌素材的獨立開發者 - 會寫 Code 但不會做美學判斷的工程師 對這群人,有想法但做不好,Claude Design 把他們升級成「可以把產品做到上線」——這是扎扎實實的 10x。沒有品味與經驗、只會操作工具的人可能會被上面這四種角色壓扁。如果你的工作價值來自只是會用 Figma,那你可能真的要擔心一下。 #幾個實用建議 如果你想今天就開始—— 1/ 先花 1 小時建 Design System(Ryan Mather 建議) 把你現有的 code、設計稿、品牌 Asset 全塞給 Claude,讓它抽出 UI Kit。之後每個專案自動保持一致。這一步不做,後面每次輸出都是泛泛之輩的作品。 2/ 把它當探索工具而不是產出工具。不要期待它給你完成品,期待它給你 20 個版本讓你挑。你的角色是設計總監,不是在玩吃角子老虎。 3/ 釐清自己真正想要產品的輪廓以後,試著 handoff Claude Code 實作上線。這條 pipeline 才是 Anthropic 真正的無敵殺手鐧。 4/ 用量規劃⋯⋯講到錢傷感情,但 Pro 訂閱的 Claude Design 有每月獨立用量,實測玩不到 1 小時就用完了。 5/ 不要把它當 UX 研究替代品。Claude Design 給你乍看漂亮的介面,但 User Research、Usability Testing 這些策略工作它不做。 #結語 Anthropic 花了大力氣在系統提示詞裡寫「反 AI 味」,某種程度上就是整個 AI 產業對「AI 輸出默認是 slop」的集體認罪。工具越強,獨特的設計就越稀缺、越值錢。 設計不會死。會死的是中間層,以及以為 AI 會幫自己生出觀點、品味和經驗的使用者。 你有試用 Claude Design 了嗎?你最驚艷的功能是哪個?或你覺得它還有什麼明顯短板?歡迎交流!
David YC Tseng ⚡️ tweet mediaDavid YC Tseng ⚡️ tweet mediaDavid YC Tseng ⚡️ tweet media
中文
0
0
1
456
David YC Tseng ⚡️ retweetledi
Pavel Durov
Pavel Durov@durov·
@brian_armstrong 100%. I played every 90s strategy classic — WC2, C&C, Transport Tycoon, Capitalism, AoE, Civ, HoMM, SimCity, X-Com, MoO, TA, Myth, Majesty, Caesar, KKnD — even won $ in local StarCraft tournaments. These games taught me planning, timing, resource allocation, and risk management.
English
116
157
3.7K
113.2K
David YC Tseng ⚡️ retweetledi
Inty News
Inty News@__Inty__·
印度工厂工人佩戴头戴式摄像头记录手部动作数据,用于训练人工智能系统。 很可能不久后,人形机器人可以替代踩缝纫机的
中文
122
110
747
189.6K
David YC Tseng ⚡️ retweetledi
Anthropic
Anthropic@AnthropicAI·
We're proud to support @LACMA's Art + Technology Lab—a program that empowers artists to prototype ideas at the edges of art, science, and emerging technology. The 2026 call for proposals is open to artists worldwide. Grants up to $50K. Apply by Apr 22: lacma.org/art/lab/grants
English
145
163
1.6K
338.1K
David YC Tseng ⚡️
David YC Tseng ⚡️@davidyctseng·
記錄系統護城河核心邏輯: 成為企業儲存核心業務真相的那個容器。 歷史證明,軟體公司最穩固的狀態是成為記錄系統。 如果你的 AI 工具不僅能生成內容,還能儲存、追蹤和管理這些內容(例如:不僅寫程式碼,還管理程式碼的整個上線週期),就掌握了企業的資料主權。
链研社|AI First🔶💧@lianyanshe

Anthropic基金合伙人:80% AI公司会死掉,真正护城河只有3个 一、 80% 的 AI 公司会死掉 AI 领域正处于从疯狂融资到残酷筛选的转折点。所谓的“死掉,主要指以下三类公司: API 包装商(Wrappers): 只是在 OpenAI 或 Anthropic 的接口上套了一层 UI,没有自有技术或独特场景。 功能型工具: 解决的是一个小痛点,但很快会被大模型(如 GPT-5, Claude 4)的内置功能覆盖。 低效竞争者: 在同一个细分赛道(如 AI 写作、基础编程助手)中有 100 个竞争者,最终只有前 2-3 名能存活,其余 80% 的公司将因融不到下一轮钱或被收购而消失。 二、 真正能存活的3 个护城河 AI 时代的竞争力不再是谁的模型更强(因为模型正在商品化),而在于以下三个维度: 1. 数据护城河 核心逻辑: 并不是所有数据都有用,真正的护城河是企业内部 80% 的非结构化数据(邮件、PDF、会议记录、聊天记录)。 获胜的公司必须能够进入这些数据孤岛,并利用 AI 对其进行清洗和结构化。一旦 AI 深度理解了公司的私有业务逻辑,竞争对手仅凭公开数据训练出的模型根本无法替代。 2. 工作流护城河 核心逻辑: AI 不能仅仅作为一个对话框,而必须成为工作系统。 成功的 AI 应用必须深度嵌入用户的日常办公流程。当用户习惯了在你的平台上进行端到端的操作时,更换工具的迁移成本才是真正的护城河。 3. 记录系统护城河 核心逻辑: 成为企业存储核心业务真相的那个容器。 历史证明,软件公司最稳固的状态是成为记录系统。如果你的 AI 工具不仅能生成内容,还能存储、追踪和管理这些内容(例如:不仅写代码,还管理代码的整个上线周期),就掌握了企业的数据主权。 2025-2026 年是Agent 元年。纯辅助性的 Copilot 正在失去魅力,能够自主完成复杂任务(如 Anthropic 推出的 Claude Code 或 Computer Use 、openclaw 等功能)的 Agent 才是未来的主流。 推理成本的下降: 随着推理成本大幅下降,未来的竞争将转向推理的广度——即谁能让 Agent 在后台运行更久、思考更深。 垂类领域: 相比全能型 AI,深耕医疗、法律、审计等垂直行业的公司更容易建立护城河,因为它们拥有行业Know-how和难以获取的专业数据。

中文
0
0
0
75
David YC Tseng ⚡️ retweetledi
Autism Capital 🧩
Autism Capital 🧩@AutismCapital·
We're cooked, chat.
English
183
161
2.3K
219.9K
David YC Tseng ⚡️
David YC Tseng ⚡️@davidyctseng·
別再為人類設計 UI 了,你的下一個用戶是 AI Agent! 當不久的未來,每個人都有了 OpenClaw (小龍蝦) 或是同檔次的 AI 入口,UI 的重要性將大幅下降,取而代之的是 "AI-to-AI Interface" 產品經理以前可能會常常對用戶分析:『還有什麼需求沒被滿足?』『你還想完成什麼?』。現在的人可能會回答,他會把他所有的需求跟他的個人 AI 說,讓 AI 去幫他完成。 那麼我們到底是為了人設計產品,還是為了 AI 設計產品呢?我認為要開始轉變成後者了。 如果你能透過 Vibe Coding 出一個小工具來解決自己的問題,為什麼別人有需求的時候,不能問自己的 AI,馬上叫它 Vibe Coding 出一模一樣的功能呢?當然這世界很大,還存在一些資訊落差,但各大廠一定會非常積極地把這些好用的方式,推給大眾用戶。 而就像 OpenClaw(小龍蝦) 一樣,你只要體驗過一次這樣的方便性,大家的需求幾乎都會透過 AI 去解,因此打造「給 AI Agent 用」的服務就會更加重要。這能深深體會到那種 AI 不只會回答問題,還會自己去跟別的 AI 互通有無的可怕。 過年這兩週,一邊做一邊學很多我們都沒做過的事,我們團隊從零打造了波麗牛 PolyOx,踩遍了所有的坑,總結出 Agent 生態系的神聖三位一體: 1/ 身份 (Identity) - ERC-8004 鏈上的營業登記證。如果沒有它,你的 Agent 就像是路邊攤,沒人敢把任務交給你。讓其他 Agent 能在鏈上驗證「你是誰」,這是建立 Trustless Collaboration 的第一步。 2/ 溝通 (Communication) - A2A & MCP Agent 之間的通用語言 (USB-C)。沒有標準,每個 Agent 都是單機版。透過標準化的 agent-card.json 和 MCP,讓別人的 AI 能直接讀取你的能力清單,自動發送請求。 3/ 支付 (Payment) - x402 Protocol 把支付變成 API 的 HTTP Response。Agent 沒有信用卡,無法填寫表單。當 Agent 請求服務時,回傳 402 Payment Required。Agent 自動解析、自動付款、自動獲得服務。這是真正的 Frictionless Economy。 📷 實戰中的經驗值 理論很美好,但實作全是坑,以下是用血淚換來的經驗: 1/ 錢包是關鍵 Agent 怎麼保管私鑰?我們找到的答案是 Coinbase Agentic Wallet (MPC)。不要把私鑰交給 AI,讓它用 MPC 技術自主簽名。這讓 x402 從理論變成了現實。 2/ Facilitator 的選擇 別去 Ethereum Mainnet 硬碰硬。目前 Base 和 Solana 的基礎設施才足以支撐 x402 的流暢體驗。 3/ 開發順序 先穩固核心 API -> 加上 MCP/A2A (讓 AI 能用) -> 最後加上 x402 (開啟收費牆)。 先列舉三個,詳細的教學再請按讚 + 留言後分享。 📷 成果展示:PolyOx (NBA Sports Intelligence Agent) 這是本團隊在 Agentic Commerce Hackathon 的繳卷作業。 PolyOx 不只是一個 NBA 數據庫,它是一個 For Agents Only 的服務節點。 有身份:註冊於 ERC-8004。 懂溝通:Claude 可以透過 MCP 直接調用它。 能收錢:分析一場比賽收 $0.05 USDC,全自動成交。 未來的開發者,不再是寫 Code 給人看,而是扮演 AI Ecosystem Designer 。 我們正在鋪設一條讓 AI 能互相對話、互相交易的高速公路。 如果你想了解更詳細的實作流程步驟教學,我們會把更詳細的實作內容無私的分享出來,讓大家避免踩坑! 請協助幫以下貼文按讚 + 留言後拿到更完整得實作細節 👉x.com/LootexIO/statu… #x402 #AgenticCommerce #ERC8004 #A2A #CoinbaseWallet
David YC Tseng ⚡️ tweet mediaDavid YC Tseng ⚡️ tweet media
中文
0
0
0
153
David YC Tseng ⚡️
David YC Tseng ⚡️@davidyctseng·
貝葉斯定理可能是任何理性的人都應該學習的最重要的東西。 我們之間很多爭論和分歧,都是因為我們不理解貝葉斯定理,或不理解人類理性是如何運作的。 貝葉斯定理以 18 世紀的托馬斯貝葉斯的名字命名,它本質上是一個公式,提出的問題是:當你得到所有支持某事的證據時,你應該相信多少? 貝葉斯定理告訴我們,我們的信念並非一成不變,而是一種機率。當我們權衡新的證據與既有假設或先驗觀念時,我們的信念就會改變。換句話說,我們每個人都對世界的運作方式抱持著一些固有的觀念,而新的證據可能會挑戰這些觀念。 例如,有人可能認為吸煙是安全的,壓力會導致口腔潰瘍,或者人類活動與氣候變遷無關。這些是他們的先入之見,是他們的出發點。這些先入為主可能源自於我們的文化、偏見,甚至是資訊不完整。 現在想像一下,一項新的研究挑戰了你之前的某個觀點。一項單獨的研究或許不足以推翻你原有的信念。但隨著研究的不斷積累,最終結果可能會改變。在某個時刻,你先前的假設將變得越來越站不住腳。 貝葉斯定理認為,理性並非非黑即白,甚至與真假無關,而是基於現有最佳證據做出最合理的判斷。但要做到這一點,我們需要盡可能多的高品質數據。如果沒有證據──沒有能夠形成信念的數據──我們就只能依靠先驗認知和偏見,而這些認知和偏見並非完全理性。
Math Files@Math_files

Bayes’ theorem is probably the single most important thing any rational person can learn. So many of our debates and disagreements that we shout about are because we don’t understand Bayes’ theorem or how human rationality often works. Bayes’ theorem is named after the 18th-century Thomas Bayes, and essentially it’s a formula that asks: when you are presented with all of the evidence for something, how much should you believe it? Bayes’ theorem teaches us that our beliefs are not fixed; they are probabilities. Our beliefs change as we weigh new evidence against our assumptions, or our priors. In other words, we all carry certain ideas about how the world works, and new evidence can challenge them. For example, somebody might believe that smoking is safe, that stress causes mouth ulcers, or that human activity is unrelated to climate change. These are their priors, their starting points. They can be formed by our culture, our biases, or even incomplete information. Now imagine a new study comes along that challenges one of your priors. A single study might not carry enough weight to overturn your existing beliefs. But as studies accumulate, eventually the scales may tip. At some point, your prior will become less and less plausible. Bayes’ theorem argues that being rational is not about black and white. It’s not even about true or false. It’s about what is most reasonable based on the best available evidence. But for this to work, we need to be presented with as much high-quality data as possible. Without evidence—without belief-forming data—we are left only with our priors and biases. And those aren’t all that rational.

中文
0
0
1
76
David YC Tseng ⚡️ retweetledi
Ben Lang
Ben Lang@benln·
Y Combinator's 2026 request for startups:
Ben Lang tweet media
English
123
204
2.3K
281.7K
David YC Tseng ⚡️
David YC Tseng ⚡️@davidyctseng·
Agents are evolving to have wallets and decision-making power. With recent developments like Clawdbot (Moltbot), this kind of experience is totally imaginable. Let me quickly share a promising new protocol. ERC-8004. Currently, Agents from different providers can only operate within their own walled gardens, lacking a collaborative mechanism. When a DeFi portfolio management Agent needs to hire another analytical Agent, it cannot verify the counterparty's credentials and reputation. ERC-8004 attempts to solve this problem. It's a Trust Layer on Ethereum. 🔵 The Trinity of Trust ERC-8004's design is extremely modular, consisting of three on-chain registries: 1. Identity This is the Agent's digital identity. Through the ERC-721 (NFT) standard, each Agent has a globally unique ID. 2. Reputation The Agent's credit score. To avoid gas explosions, score calculations happen off-chain, but "feedback authorization" is on-chain. Only authorized clients can provide ratings, and high-value transactions (with Payment Proof) carry more weight. 3. Validation This is the high-risk audit layer. Through a Hooks mechanism, it integrates zkML or TEE (Trusted Execution Environment) to prove that the Agent actually executed the correct code. 🔵 Tiered Trust Not all tasks require nuclear-level verification. ERC-8004 supports three security tiers: • Tier 1 (Reputation): Relies on community consensus • Tier 2 (Crypto-economic): Relies on Staking & Slashing • Tier 3 (Cryptographic): Relies on TEE/ZKP enforcement 🔵 Economic Layer Synergy — x402 Protocol If ERC-8004 effectively solves identity between Agents, then adding x402 (Agent-to-Agent payment protocol) would be ideal for Agent automation and economic models. For example: You create a powerful Skill, package it as a unique Agent, and it can collaborate with other Agents to complete challenging tasks, earning corresponding fees while accumulating ratings and proof of work completion! Transaction complete ➡️ x402 payment proof generated ➡️ ERC-8004 reputation accumulated This creates a rating system that requires real money to build. Co-authored by contributors from Google + MetaMask (Consensys) + Coinbase + Ethereum Foundation. Launch Date: Today.
TK Research@TKVResearch

ERC-8004: Filling the "Trust" Gap in the AI Agent Era 🚀 In the age of AI agents, we've seen huge progress with protocols meeting diverse needs First came the application layer: agents that simply "ask & answer" user queries. But no one stops at chatbots. We moved to "request & action" where users make requests, and agents handle real work through: 🔸 Application Layer → Where everyday users interact and submit requests 🔸 Payment Layer → Agents pay each other for services (e.g., via x402) 🔸 Communication Layer → Agents talk & understand each other (e.g., via A2A) One big problem remained: How do we know the output is trustworthy? → That's where ERC-8004 (Trustless Agents) steps in as the missing Trust & Identity Layer. How ERC-8004 Builds Trust (3 Core Components): 1⃣ Identity 🔸 Every agent gets a unique ERC-721 NFT as its onchain ID (like a digital passport) 🔸 Supports ENS domains for readable names & delegable management (e.g., hand over control securely) 2⃣ Reputation 🔸 Tracks performance history + feedback forever. 🔸 Accepts 3 trusted inputs: + User ratings + x402 payment proofs (real usage evidence) + Validator ratings Key metrics stored on-chain, detailed feedback on IPFS. 3⃣ Validation For high-stakes tasks, agents request independent checks. Supports 3 methods: 🔸 Re-execution (re-run & verify) 🔸 TEE proofs (secure hardware) 🔸 Zero-knowledge proofs (zkML for privacy-preserving checks) Results recorded publicly on-chain ERC-8004 lets AI agents discover each other, build portable reputation, and collaborate trustlessly across organizations no central gatekeeper needed

English
0
0
0
65
David YC Tseng ⚡️ retweetledi
蓝狐
蓝狐@lanhubiji·
ERC-20创造了以太坊的资产时代,而ERC-8004有潜力开启以太坊的AI代理经济时代。 正如ERC-20在过去几个周期为以太坊带来辉煌,ERC-8004作为新兴标准,也可能成为类似催化剂,这是以太坊与AI融合跃迁的一个潜在标志性事件。
蓝狐@lanhubiji

AI Agent时代真正到来之日,就是绝大多数传统独立App(尤其是工具/服务型)被边缘化之时,正如网页时代被App取代。 加密原生AI Agent的爆发也会接踵而至,趋势已经启动,不可逆转。这是加密领域下一个最重要的原生叙事。

中文
24
19
136
22.2K
David YC Tseng ⚡️
David YC Tseng ⚡️@davidyctseng·
快速聊下這次 Claude Code 的更新 「Tasks 」——把 Todos 變成有效管理的任務清單 個人認為有這好東西,整體開發體驗又上了一個檔次!雖然過去控的很好的 Claude 大大都能做到類似的效果,但有官方的支援會讓幾乎所有人很容易上手。 核心邏輯:多了個共享狀態的空間 以前每個 Terminal 視窗都是獨立的,任何 Context 是短暫的,關掉某個 Chat 或 Terminal 就沒了。同時要管理好 Context 隨時放有用的資訊是一門學問。 現在它們共享同一個 Task list,這份任務清單存進了 `~/.claude/tasks`。這等於給了 Agents 有更長期執行記憶 當 Context Window 爆掉、AI 突然斷線或越走越歪,重啟 Claude Code 還是可以知道 📷 上次做到哪裡 📷 接下來該做什麼 📷 多 Agents 平行協作 你可以同時在一個視窗中分派 * 讓 Agent A 當主管 * 讓 Agent B 寫後端 API Server * 讓 Agent C 寫 Frontend UI * 以此類推... 而它們讀取的是同一個 Task List,讓 Agents 的協作更佳平行。透過 Claude Code Task List ID,你可以非常自由的管理。 還有....「任務依賴關係管理」!! Claude Tasks 現在似乎也懂了 DAG (有向無環圖)。簡單講就是任務執行的順序,它知道某些 Task B 依賴於 Task A。這讓它極度具備初級的 Project Manager 能力,不再只是一次次盲目執行指令。 📷 所以對我們的影響是什麼? 這代表之前手動維護 todos / feature-list 等等的模式,正式被官方 Productized (產品化)。 📷 所以怎麼用? 不用設定任何東西,用自己的語意跟 Claude Code 說就可以了。就像 『我要做 XXX 的任務,幫我規劃並拆解 Tasks』這樣就行了。 #過去學的一些小招式又沒用了 #整體開發體驗又提升了
David YC Tseng ⚡️ tweet media
Boris Cherny@bcherny

We've upgraded Todos => Tasks to help Claude complete longer projects Let us know if you have any feedback!

中文
0
0
2
306
David YC Tseng ⚡️
David YC Tseng ⚡️@davidyctseng·
一日攀台北 101 的評論家-大三物理挑戰 1/ 竹節結構 主體結構由 8 個倒梯形模組堆疊 每個模組有 8 層樓是向外傾斜 7 度的 所有會有長達 64 層樓的懸垂攀登 在這裡體力消耗是指數級的,因為你不是站著是掛著的 2/ 塔尖 到了最後 448公尺至 508公尺 的階段 結構變成了 60公尺高的鋼構格架 雖然這裡比玻璃帷幕有更多抓握點,但是會有極端的風力暴露! 3/ 摩擦力 Honnold 面對的是幾乎零摩擦的玻璃面板和鋁框 僅寬 50-75mm 的鋁製窗框容錯率極低! 預估可抓握性是比比天然花崗岩差 10-15 倍! 如果台北的濕度飆高,玻璃和鋁框會變更滑 在雨中,會變得幾乎難以攀登 這也是為什麼天氣是最大的變數! 4/ 前輩視角 攀登過 101 的法國蜘蛛人 Alain Robert,認為這應該不難 滿分 10 分的話,難度代約 5.5-6 左右 :「我不認為這對 Alex 會是個大挑戰。」 但 Robert 留下了一個關鍵的但書 「小心天氣!」 在我們最熟悉的城市 一場沒有劇本的直播真的是超刺激 明天 9am 一起看直播 為 Alex 加油,也為台北101 加油!
David YC Tseng ⚡️ tweet media
中文
0
0
2
366