lee lion

29 posts

lee lion

lee lion

@euclid_lee

Katılım Ekim 2025
32 Takip Edilen0 Takipçiler
马天翼
马天翼@fkysly·
我是不太认同 Harness 那套的,而且大部分 Harness 流程都只是固定的 Workflow,而不是真正 Agent 自主执行。 我是坚定的 Vibe Coding 党,我觉得跟 CC、Codex 聊天指挥还是当下的最优解
中文
74
5
117
46.4K
lee lion
lee lion@euclid_lee·
有点焦虑了,harness和llm wiki出来后。没新的概念了
中文
0
0
0
7
lee lion
lee lion@euclid_lee·
做agent平台类产品的各位真的使用自己做的产品迭代自己么,还是用codex和claude一直打磨自己的产品
中文
0
0
0
4
lee lion
lee lion@euclid_lee·
求问哪种e2e最快最准 Chromedev playwright browerse use agent browerser
中文
0
0
0
4
露西的百宝箱
露西的百宝箱@Lucy_love_AI·
GPT-5.5 刚刚发布,人们已经开始制造本不应该存在的东西。 10个例子会让你大开眼界:
中文
6
23
258
207.2K
lee lion
lee lion@euclid_lee·
@rwayne 有人用过么😂纯好奇感觉有点过于火热但是一个实践的都没
中文
0
0
0
54
Roland.W
Roland.W@rwayne·
终于有人把「工程化用 AI 写代码」做成 skill 包公开了。 Matt Pocock 自己 .claude 目录里的实战技能集,包括 grill-with-docs、tdd、improve-codebase-architecture、triage 等,专治 agent 对齐差和代码质量塌方。 vibe coding 是临时手艺 这套 skill 把 agent 推到生产级流程上
Roland.W tweet media
中文
66
11
59
5.2K
lee lion
lee lion@euclid_lee·
@dotey 我会推荐他用claude写
中文
0
0
0
112
宝玉
宝玉@dotey·
你的同学小明发现 DeepSeek 写作功能强大,便打算以后所有的作文都用它完成,不再自己动笔。 你会怎样劝说他?
宝玉 tweet media
中文
250
5
179
155.1K
Cheng
Cheng@scomper·
读完 @karpathy LLM 知识库工作流,也尝试清理了 Obsidian Clippings。核心洞察:LLM 不是问答机,是知识编译器。raw/ 丢资料 → LLM 增量编译成 Wiki(摘要+反链+归类)→ 查询结果写回,知识越用越厚。 #LLM #Obsidian
Cheng tweet media
中文
3
9
62
8.9K
lee lion
lee lion@euclid_lee·
@yan5xu 感觉得有个自动进化的知识库,既能新增知识,也能对已有知识评判修改之前的记忆,感觉现在很多都是append,很少有update的
中文
2
0
0
894
yan5xu
yan5xu@yan5xu·
最近一直在思考 Harness Engineering,架构约束、AGENTS.md、意图规范、自动化反馈回路,这些做法完全没问题,但总感觉有点模糊。后来发现,模糊不在做法本身,而是它没有说明白,它的出现是为了解决什么核心问题。 Agent 的协作有两个区间。Copilot 区间是人在 loop 的同步协作,你和 Agent 实时交互,每一步你都参与决策。Delegate 区间是人离开 loop 的异步委托,你把任务交出去,Agent 独立决策和执行,做完交回来验收。 Agent 能力在增长,能做的事越来越多,独立工作时间越来越长。一个跑几分钟的任务你可以盯着,一个跑两小时的任务你盯不住,也不应该盯。工作时间变长,你和 Agent 协作的方式就会自然地从 Copilot 区间滑入 Delegate 区间。 但同步和异步的工作方式,带来的挑战完全不一样。同步模式下你实时参与,随时能给出上下文进行纠偏,容错成本很低。一旦变成异步,任务定义不清 Agent 就跑偏,过程中出了问题没人拦,验收时一堆东西堆在一起 review。导致在产品设计上就需要不一样的思路。 所以核心矛盾是:Agent 因为能力增强,正在从同步模式转向异步模式。这种不可逆的趋势下,真正的题是怎么构建安全的异步委托机制,让这个转变可控。 Harness Engineering 就是在做这件事。它把整个系统反馈回路里的客观信号,编译器、类型检查、lint、测试、CI、线上日志、Sentry、可观测性平台,直接接到 Agent 面前,去掉人作为中间传递者的角色,让 Agent 自己读信号、自己闭环。 但除了客观信号,还有主观信号。方向对不对,命名好不好,方案该不该推翻,用户真正想要的到底是什么。这些判断只存在于人的脑子里,环境中没有对应的信号源,Harness 再完善也接不进去一个不存在的东西。 这是两个不同性质的问题。客观信号是工程问题,接上就行。主观信号是知识沉淀外化问题,它带来的是产品和技术上的双重设计挑战:如何让人或者组织自然、甚至无感地进行知识沉淀外化。难得多,但也是 Delegate 区间能不能真正持续扩大的关键。 还有一个有意思的现象:我们构建的异步委托机制越完善,Agent 异步工作就越安全,人需要介入的地方就越少,Delegate 区间进一步扩大。Agent 能力的增长在推,基础设施的完善也在推,两股力同向,Delegate 只会越来越多。 所以啊,今年会不会产品或者方法论,解决知识沉淀外化的问题呢🤔
中文
16
26
201
21.6K
lee lion
lee lion@euclid_lee·
现在很多cli出来了,如何把cli做成skill有什么好的起手式么
中文
0
0
0
6
kabikabi
kabikabi@jakevin7·
twitter目前感觉应该是最好的平台之一了。 在这上面学到了很多东西,也build in public了很多。 Thanks everyone
中文
26
1
268
19.4K
lee lion
lee lion@euclid_lee·
harness具象化了
日本語
0
0
1
9
Leo
Leo@runes_leo·
给 Claude Code 装了 19 个抓网页的工具,结果最大的问题变成了:拿到一个链接,到底该用哪个? xreach、Jina、Chrome MCP、Playwright、Apify、Scrapling……同一个需求经常有四五个能干,靠记忆选,选错就是一轮试错。 今天装了个 web-access,CDP 直连日常 Chrome,零配置就能复用所有登录态。微信、小红书、知乎,不用再折腾 cookie 和模拟登录了。正好借这个机会把 19 个工具全盘了一遍,按场景排了张优先级表: 读推文 → xreach 公开网页 → Jina 需要登录的站 → web-access(CDP 直连 Chrome) 浏览器交互 → Chrome MCP 反爬 → Scrapling JS 重渲染 → Playwright 全都不行 → XCrawl 兜底 写进路由规则,AI 自己按表选工具,拿到 URL 5 秒出结果,不再试错。
Leo tweet media
中文
19
95
467
63.8K
lee lion
lee lion@euclid_lee·
最近vibe了个基于无限画布和看板管理和tab管理 一体的macos应用,基于worktree+gitdiff可以并发管理多个会话,并且能看到多个会话的流转情况,主要解决几个问题 1. 会话太多无法管理 2. 单一tab或者画布形式不太好管控 3. 同时控制发送多个会话,review后批准他们继续执行 大家觉得有什么改进意见
中文
0
0
1
59
lee lion
lee lion@euclid_lee·
@jakevin7 这个生成各个平台的cli接口的方式,是有什么skill么,还是在开源的opencli里有用的地方
中文
0
0
0
588
kabikabi
kabikabi@jakevin7·
opencli 支持 CLI 化所有 electron 应用!最强大更新来袭! CLI all electron!现在支持把所有 electron 应用 CLI 化,这样可以组合各种神奇能力。 我最近大量使用 Antigravity Ultra,虽然它量大但工具难用,并且不容易扩展。现在通过 OpenCLI 把他 CLI 化。 Claude 桌面版也是 electron,目前也可以支持哦! 现在可以 AI 自己控制自己!自己驱动自己写代码! 通过 cc/openclaw 远程控制任何 electron 应用! 无限玩法!!
kabikabi tweet mediakabikabi tweet media
中文
54
54
493
96.9K
lee lion
lee lion@euclid_lee·
@yadong_xie 感觉代码作为上下文,在已有大项目上内容量太大了,更容易幻觉,尤其是多人维护,写了点脏东西,或者很多都不是关键信息,很多代码都是辅助一个核心方法写的,这种对AI的要求太高了。或者新项目都没有代码,spec说是规范,最终还是为这次prompt的session最优上下文服务,主要就是要那种指哪打哪的感觉
中文
0
0
1
183
Yadong Xie
Yadong Xie@yadong_xie·
正确的使用 spec driven 有几个关键点: 1. 如何划分 scope 让 agent 在合理的 context 内能够并行工作 2. 如何设置合理的验收逻辑,让 agent 能够在合理循环内结束 3. 如何正确的设置 feedback loop,让 agent 能够在有限次数内收敛 其实整个设计就是《自动控制原理》 自动控制原理是研究在无人直接参与的情况下,通过控制装置使被控对象按预定规律运行的技术科学 死去多年的自动化专业又在攻击我
Yadong Xie@yadong_xie

这篇文章建立在一个错误的假设前提下,code 会永远存在并且做为产品的 single source of truth 事实上的最后产品的 spec 才是 SoT,code 的角色最终会变成 bin 或者汇编 code 不是资产,spec 才是,每次有更好的模型就可以从 spec 获得更好的 code implement,而不是让 ai 在 code 的 shit mountain 上痛苦的理解产品的 spec

中文
2
5
45
15.8K