Sabitlenmiş Tweet
lee lion
29 posts


最近一直在思考 Harness Engineering,架构约束、AGENTS.md、意图规范、自动化反馈回路,这些做法完全没问题,但总感觉有点模糊。后来发现,模糊不在做法本身,而是它没有说明白,它的出现是为了解决什么核心问题。
Agent 的协作有两个区间。Copilot 区间是人在 loop 的同步协作,你和 Agent 实时交互,每一步你都参与决策。Delegate 区间是人离开 loop 的异步委托,你把任务交出去,Agent 独立决策和执行,做完交回来验收。
Agent 能力在增长,能做的事越来越多,独立工作时间越来越长。一个跑几分钟的任务你可以盯着,一个跑两小时的任务你盯不住,也不应该盯。工作时间变长,你和 Agent 协作的方式就会自然地从 Copilot 区间滑入 Delegate 区间。
但同步和异步的工作方式,带来的挑战完全不一样。同步模式下你实时参与,随时能给出上下文进行纠偏,容错成本很低。一旦变成异步,任务定义不清 Agent 就跑偏,过程中出了问题没人拦,验收时一堆东西堆在一起 review。导致在产品设计上就需要不一样的思路。
所以核心矛盾是:Agent 因为能力增强,正在从同步模式转向异步模式。这种不可逆的趋势下,真正的题是怎么构建安全的异步委托机制,让这个转变可控。
Harness Engineering 就是在做这件事。它把整个系统反馈回路里的客观信号,编译器、类型检查、lint、测试、CI、线上日志、Sentry、可观测性平台,直接接到 Agent 面前,去掉人作为中间传递者的角色,让 Agent 自己读信号、自己闭环。
但除了客观信号,还有主观信号。方向对不对,命名好不好,方案该不该推翻,用户真正想要的到底是什么。这些判断只存在于人的脑子里,环境中没有对应的信号源,Harness 再完善也接不进去一个不存在的东西。
这是两个不同性质的问题。客观信号是工程问题,接上就行。主观信号是知识沉淀外化问题,它带来的是产品和技术上的双重设计挑战:如何让人或者组织自然、甚至无感地进行知识沉淀外化。难得多,但也是 Delegate 区间能不能真正持续扩大的关键。
还有一个有意思的现象:我们构建的异步委托机制越完善,Agent 异步工作就越安全,人需要介入的地方就越少,Delegate 区间进一步扩大。Agent 能力的增长在推,基础设施的完善也在推,两股力同向,Delegate 只会越来越多。
所以啊,今年会不会产品或者方法论,解决知识沉淀外化的问题呢🤔
中文

给 Claude Code 装了 19 个抓网页的工具,结果最大的问题变成了:拿到一个链接,到底该用哪个?
xreach、Jina、Chrome MCP、Playwright、Apify、Scrapling……同一个需求经常有四五个能干,靠记忆选,选错就是一轮试错。
今天装了个 web-access,CDP 直连日常 Chrome,零配置就能复用所有登录态。微信、小红书、知乎,不用再折腾 cookie 和模拟登录了。正好借这个机会把 19 个工具全盘了一遍,按场景排了张优先级表:
读推文 → xreach
公开网页 → Jina
需要登录的站 → web-access(CDP 直连 Chrome)
浏览器交互 → Chrome MCP
反爬 → Scrapling
JS 重渲染 → Playwright
全都不行 → XCrawl 兜底
写进路由规则,AI 自己按表选工具,拿到 URL 5 秒出结果,不再试错。

中文

这个思路非常好,有时候是我们限制了ai的生成,标准定的太低,让他有一个高标场景,他往往做的更好
0xTank | PopLab.AI@tankxu
这个 Skill 没啥用,实践下来目前 AI 生成 Logo 关键还是大量抽卡,提示词工程能起到的效果不大。 我常用的方式很暴力,一张图里生成一批 Logo 而不是单个,把 Nano Banana、ChatGPT、即梦等能用的生图模型都用起来,让它们生成 Logo 墙,多次尝试获得一堆的方案,找到一个喜欢的图形再截出来继续加工。不过作为设计师我还是更喜欢直接在纸上画 Logo。 举个例子,提示词“我要一个获得平面设计大奖的Logo展示墙,Logo设计主题是monkey”
中文

@yadong_xie 感觉代码作为上下文,在已有大项目上内容量太大了,更容易幻觉,尤其是多人维护,写了点脏东西,或者很多都不是关键信息,很多代码都是辅助一个核心方法写的,这种对AI的要求太高了。或者新项目都没有代码,spec说是规范,最终还是为这次prompt的session最优上下文服务,主要就是要那种指哪打哪的感觉
中文

正确的使用 spec driven 有几个关键点:
1. 如何划分 scope 让 agent 在合理的 context 内能够并行工作
2. 如何设置合理的验收逻辑,让 agent 能够在合理循环内结束
3. 如何正确的设置 feedback loop,让 agent 能够在有限次数内收敛
其实整个设计就是《自动控制原理》
自动控制原理是研究在无人直接参与的情况下,通过控制装置使被控对象按预定规律运行的技术科学
死去多年的自动化专业又在攻击我
Yadong Xie@yadong_xie
这篇文章建立在一个错误的假设前提下,code 会永远存在并且做为产品的 single source of truth 事实上的最后产品的 spec 才是 SoT,code 的角色最终会变成 bin 或者汇编 code 不是资产,spec 才是,每次有更好的模型就可以从 spec 获得更好的 code implement,而不是让 ai 在 code 的 shit mountain 上痛苦的理解产品的 spec
中文











