ihower
6.2K posts

ihower
@ihower
indie consultant & software developer, author of 愛好 AI Engineer newsletter (zh-TW) 👨🏻💻🤖
Hsinchu, Taiwan Beigetreten Ağustos 2007
1.3K Folgt10.2K Follower

愛好 AI Engineer 電子報第 35 期發刊 📬
這期做了一些改變:開始更多用 AI Agent 幫我直接處理內容發佈,選題還是我人工選的。分享了 26 篇對 Agent、Evals、Context Engineering 等 AI 工程主題的精彩文章,包括:
* 如何選擇 Multi-Agent 架構?
* 為什麼多數 Agent 框架都沒有內化 Bitter Lesson?
* AI Evals 閃卡全解析: Hamel Husain 的 12 張精華卡片
* LangSmith Insights Agent 深度拆解: 從 Clio 論文到生產級 Agent 的完整旅程
* AI Agent 時代,Trace 才是你的 Source of Truth
* AI Agent 怎麼管理 Context? 從設計模式到 Deep Agents 實作
* Agent Files: 檔案系統正在成為 AI Agent 的核心介面
* Agent Skills 完整攻略: 從建立到評估
電子報全文: ihower.tw/blog/13630-aie…
中文
ihower retweetet

My free solo ascent of Taipei 101 in Taiwan is coming up soon - and you can watch it LIVE on @netflix. January 23 @ 8 PM ET / 5 PM PT. Exciting!!
English

發了愛好 AI Engineer 電子報第 34 期,這期集結的內容有:
- Andrej Karpathy: 2025 年度回顧
- Andrej Karpathy: 2025/10 訪談
- OpenAI 研發長 Mark Chen 2025/12 訪談
- AI in 2025: gestalt
- Thoughts on AI progress (Dec 2025)
- YC: The Truth About The AI Bubble
- The Agent Labs Thesis
- 你的工作是提交已被驗證可運作的程式碼!
- 反向半人馬
- AI Coding Accelerator: How Amp uses Amp
- Evaluating Context Compression for AI Agents 評測
- 搜尋技術不會消失,只是變成 Agent 的工具: 談 Agentic Search
- OpenAI Agents SDK 開發日記: Gemini 3 和跨模型對話支援
- Agent Skills 資料整理
全文在我部落格,歡迎追蹤訂閱: ihower.tw/blog/13612-aie…
中文

提交的 Gemini 3 Pro 整合終於 merged 進 OpenAI Agents SDK 啦 😁
這個 PR 花了不少時間,除了支援 Gemini 3 Pro 的 thought_signatures (function calling 時需要帶上這個簽章),同時我也實現跨模型對話兼容性,例如 OpenAI ↔ Gemini ↔ Claude 可以共用同一份對話歷史,可以讓用戶隨時切換模型,或是 agentic workflow 中做交接。
詳細 PR: github.com/openai/openai-…
中文

發了愛好 AI Engineer 電子報第 33 期,這期集結的內容有:
- 2025 Q4 新模型
- 實戰 AI Agents 應用開發: TTFT 和 Prompt Caching
- AI Agent 產品開發仍然不簡單
- Spec-Driven Development(SDD) 的美好願景與殘酷現實
- Framework Desktop 開箱
- 我的 OpenAI Agents SDK 開發心得
- 關於 Context Engineering 上下文工程
- 做 LLM-as-a-Judge 評估,別用 1-10 分評分了
- RFT, DPO, SFT: Fine-tuning with OpenAI
- Anthropic 的 Agent Skills 技術解析
- 開源模型生態現況 The State of Open Models
全文在我部落格,歡迎追蹤訂閱。
中文

今天在 WenConf 分享: 實戰 AI Agents 應用開發,釋出我的投影片: ihower.tw/blog/13501-pra…
- 架構選擇: OpenAI Agents SDK + FastAPI
- 前後端整合的發展
- TTFT 指標和改進
- Prompt Caching
- 上下文工程
現場講有做一些 live demo,簡單看一下 code 然後實際跑出效果。
中文

AI-Powered Search by @treygrainger & @softwaredoug & @aiPoweredSearch: the most in-depth course I've taken for leveling up retrieval skills.
Moved me from "throw embeddings at it and hope" to actually understanding query intent, ranking signals, and production RAG patterns.
Hands-on labs + expert guest speakers from Qdrant, OpenSearch, Superlinked made it incredibly practical.
Essential for anyone serious about search & RAG. Next cohort in March 👉 aipoweredsearch.com/live-course?pr…
English
ihower retweetet

OpenAI Agents SDK v0.6.0 github.com/openai/openai-…
GPT 5.1 文件: platform.openai.com/docs/guides/la…
Indonesia

OpenAI Agents SDK v0.6.0 釋出✌️
這次我貢獻了升級 openai-python 到 2.8.0 以增加對 GPT 5.1 的支援,包括 reasoning effort 可以是 none,以及添加 prompt_cache_retention 參數可以延長快取時間。
都是蠻實用的功能:
1. 之前 GPT-5 的 reasoning effort 最低是 minimal,而且不支援用內建工具例如 web_search,導致不太好用。這次 GPT-5.1 拿掉 minimal 改成用 none,也支援內建工具了,用意更明顯就是想要取代 GPT-4.1,成為非推理需求下的首選模型。
2. Prompt caching 對於開發 Agent 應用的 latency 和成本節省非常重要,這次可以延長到 24h 超級實用!
中文

Agent Skills PoC using OpenAI API colab.research.google.com/drive/1RuVd40t…
English

Checked out Anthropic's new Agent Skills: It's basically a repackaged Code Interpreter, but with a clever use case 👍
1. Upload pre-written scripts to a container for the agent to run
2. Use function calling to reveal context in two stages
In short, a "skill" is scripts with detailed instructions, optimized via context engineering: simple descriptions go in the system prompt for selection, full instructions are revealed later via tools.
I made a Google Colab using Code Interpreter and OpenAI Agents SDK to demo a PoC, if you're familiar with the agent concept, you’ll get it from the Colab.
English

看了一下 Anthropic 最新推出的 Agent Skills 功能,來技術解析一下,這其實是個 Code Interpreter 的包裝功能,是蠻有意思的用法 👍
1. 先把寫好的 script 先傳到 container 裡面,讓 agent 可以執行
2. 搭配 function calling 做兩階段的 context 揭露
基本上 skill 等於 一些預先寫好的 script 程式,搭配完整的操作指示,讓 Code Interpreter 可以直接執行它。另外也做了 Context Enginering 優化: skill 描述分成 1. 簡單描述直接放 system prompt 讓 agent 挑選 2. 完整操作描述需要用工具進一步揭露。
我寫成了一份 Google colab 用 Code Interpreter 和 OpenAI Agents SDK,示範做了一個 PoC 出來,如果你知道什麼 Code Interpreter 和 Agent,那看這份 colab 你也會做了。
中文





