yeshadoo
4.8K posts

yeshadoo
@yeshadoo
Health🏃➕Calm🧘➕Build💡➕Love❤️
Kansas City, MO Katılım Mart 2018
1.2K Takip Edilen118 Takipçiler
yeshadoo retweetledi
yeshadoo retweetledi

Claude Code 负责人 @bcherny 说他已经不 prompt Claude 了。是循环在 prompt Claude、在决定下一步,他的活变成了写那个循环。Addy Osmani 给这事起了个名,叫 loop engineering:你不再是那个一轮轮敲 prompt 的人,而是搭一个会自己找活、分发、检查、记账、定下一步的系统,让它去捅 agent。
循环就五个零件,Claude Code 和 Codex 现在都备齐了。Automations 是心跳:定时自己跑、自己发现和分流,有结果进 Triage 收件箱,没结果就归档(/loop 按周期重跑,/goal 跑到你写的可验证条件为真才停,每轮完一个独立小模型来判断算不算完成,写代码的 agent 没资格给自己打分)。Worktrees:git worktree 给每个并行 agent 一份独立 checkout,从机制上断了它们踩同一个文件的可能。Skills:SKILL.md 把项目知识摊在外面,省得 agent 每次像金鱼一样重猜一遍,没它循环每轮都从零重推你的项目。Connectors(建在 MCP 上):让循环够得着 issue tracker、数据库、staging API、Slack,差别就在「这是修复方案」和「自己开 PR、关联 ticket、CI 绿了就 ping 频道」之间。Sub-agents:写的人和检查的人分开,毕竟写代码的模型给自己打分总是手软。
还有第六件,最不起眼,可能也最要命:memory。一个 markdown 文件,或者一块 Linear board,活在单次对话之外,记着做过什么、下一步干嘛。模型每跑一次就忘光上一次,所以记忆得落在磁盘上,不能搁在 context 里。一句话,agent 会忘,repo 不会。
但有三件事循环没替你解决,而且循环越顺,这三件越扎手。第一,验证还是你的事:没人盯着的循环,也是在没人盯着地犯错,done 只是它的声明,不是证明。第二,你的理解会烂掉:循环越快地 ship 那些你没亲手写的代码,你和代码之间的鸿沟就越宽。第三,最舒服的姿势往往最危险——循环自己转起来,你很容易就不再有观点、照单全收。所以那句话是对的:Build the loop, stay the engineer,循环你来搭,但工程师这个位子得你自己坐着。
Addy Osmani@addyosmani
中文
yeshadoo retweetledi

这篇论文让我感觉,我们对「AI 会取代程序员」这件事的讨论方向可能全错了。
核心观点:AI Agent 的出现不是让软件工程师工作效率更高,而是让「把决策逻辑永久编码进软件」这件事本身变得越来越不必要。
作者说的是一个更根本的范式变化:传统软件工程的本质是,人类把判断逻辑「固化」成代码——if-else、状态机、算法,这些都是把人类决策「提前写死」的方式。但在以 LLM 为核心推理引擎的 Agent 系统里,代码变成了「临时生成、用完即扔的工具」,每次任务,Agent 动态生成需要的代码,执行完就不需要了。决策不再被预先编码,而是在运行时由 LLM 推理循环动态产生。这不是增量改进,而是软件生产范式的结构性替换。
我觉得这个观点里最值得注意的细节是:这不只是生产力工具的升级,而是「软件」这个概念本身的角色在变。以前代码是「系统的中心」,Agent 框架是外壳。现在 LLM 推理循环是中心,代码变成了外壳里的临时辅助。如果这个趋势持续,软件工程的核心能力可能不再是「写出好代码」,而是「设计出可靠的推理约束边界」。
以前我们关注写出可维护的代码,以后可能更要关注设计出可靠的推理边界。
arxiv.org/pdf/2606.05608

中文

午饭后,在我喝着瑞幸的新品烤椰咖啡时,追着《疑犯追踪》时,在走神之际,突然想明白了一个道理,这是一种醍醐灌顶的感觉。
最近正在进行学习方式的转换,收集了很多English Computer Science Books, Papers,但是学习效率很低,因为摆在面前的是两座大山,不仅要理解并掌握技术原理,还要面对源源不断涌出的新的英文词汇。
突然想起了重构的艺术,目前我所进行的是学习体系的重构,重构是为了more effective and better performance,而重构的方法论是小步快跑,逐步切换并验证,需要保证每一个阶段都是可执行的。然后,我目前的学习方式几乎完全摒弃了中文资料,完全扑向了英文材料,可以肯定的是,方向是对的,然后方式比较极端,心态比较急躁,这是不好的。
接下里要做的是逐步切换,随着时间的积累,我相信我可以在重构之后的新架构之上,有所收益的。你看,这就是计算机哲学。
中文
yeshadoo retweetledi

📚 awesome-harness-engineering,这个项目收录的知识含金量远超这个数字——OpenAI、Anthropic、微软、Meta 的一线工程实践全在里头。
GitHub:github.com/ai-boost/aweso…
决定 agent 好不好用的,不是模型,是包在模型外面的 herness。
上下文怎么喂、工具接口怎么设计、验证回路怎么跑、记忆系统怎么管——这些加在一起叫 harness engineering,这个项目里的资料让你学到一手工程实践。
LangChain 把一个 coding agent 从 Terminal Bench 第 30 名拉到前 5,靠的就是改了 harness 设计。
微软的 Azure SRE agent 自主处理了 35000+ 起生产事故,复盘文章就在里头。
Anthropic 的长时任务 harness 设计指南、上下文工程指南、Claude Code 内部架构的逆向分析论文,全部收录。
还有 Martin Fowler 写的 harness engineering 综述、
OpenAI 的 Codex agent loop 拆解,覆盖了规划与任务分解、上下文压缩、权限沙箱、可观测、human-in-the-loop 的整条链路。
Ren@FakeMaidenMaker
中文
yeshadoo retweetledi
yeshadoo retweetledi
yeshadoo retweetledi

📘 高质量开源项目推荐:《Agents Best Practices》—— 生产级AI Agent Harness设计指南
这是一个 provider-neutral Agent Skill,专为 Claude Code、Codex 等 AI Coding 工具设计,提供构建可靠 agentic harness(运行时框架)的完整最佳实践参考。
核心理念非常清晰: “模型只负责提出动作,Harness 负责验证、授权、执行、记录并返回观察结果。”强调运行时严谨性而非仅靠 Prompt,让 Agent 从“偶尔能用”走向生产级可靠。
仓库包含大量实用内容:
1. Agentic Loop(模型-工具-观察循环)
2. 窄型工具与权限检查
3. 规划模式、流程编排
4. 上下文管理、记忆压缩
5. 技能/连接器、提示缓存、可观测性、评估体系
6. MVP Agent 蓝图生成、现有 Harness 审计清单等
特别适合正在使用 Claude Code、Codex 或构建多 Agent 系统的开发者、AI Agent 工程师和科研工作者。
与我之前推荐的《Learn Harness Engineering》和《Harness Books》高度互补,可作为理论+实践的进阶参考。目前已获得 1.2k+ stars ⭐。
github.com/DenisSergeevit…
#AIAgent #ClaudeCode #HarnessEngineering #Codex
#AI教程
中文
yeshadoo retweetledi

保姆级把一本书变成skill的教程,
也是一个超棒的副业赚钱项目,
按我这个方法,把一本书做成 skills,
闲鱼一个卖个 19 块 9、29 块 9绝对能卖爆,
小红书的客单价更高,可以挂 99~199,
教程和思路方法都告诉大家了,能不能赚钱就看个人执行力了

AYi@AYi_AInotes
中文
yeshadoo retweetledi

yeshadoo retweetledi











