lee lion

29 posts

lee lion

@euclid_lee

Katılım Ekim 2025

32 Takip Edilen0 Takipçiler

Sabitlenmiş Tweet

lee lion@euclid_lee·28 Mar

Meka Flow发布：多智能体协作平台，支持harness的模式探索 github.com/osvald-go2/mek…

中文

lee lion@euclid_lee·11 May

@fkysly 大道至简哈哈

中文

376

马天翼@fkysly·11 May

我是不太认同 Harness 那套的，而且大部分 Harness 流程都只是固定的 Workflow，而不是真正 Agent 自主执行。我是坚定的 Vibe Coding 党，我觉得跟 CC、Codex 聊天指挥还是当下的最优解

中文

117

46.4K

lee lion@euclid_lee·10 May

有点焦虑了，harness和llm wiki出来后。没新的概念了

中文

lee lion@euclid_lee·8 May

做agent平台类产品的各位真的使用自己做的产品迭代自己么，还是用codex和claude一直打磨自己的产品

中文

lee lion@euclid_lee·4 May

求问哪种e2e最快最准 Chromedev playwright browerse use agent browerser

中文

lee lion@euclid_lee·3 May

@Lucy_love_AI 为啥我做的很low

中文

3.4K

露西的百宝箱@Lucy_love_AI·3 May

GPT-5.5 刚刚发布，人们已经开始制造本不应该存在的东西。 10个例子会让你大开眼界：

中文

258

207.2K

lee lion@euclid_lee·3 May

@rwayne 有人用过么😂纯好奇感觉有点过于火热但是一个实践的都没

中文

Roland.W@rwayne·2 May

终于有人把「工程化用 AI 写代码」做成 skill 包公开了。 Matt Pocock 自己 .claude 目录里的实战技能集，包括 grill-with-docs、tdd、improve-codebase-architecture、triage 等，专治 agent 对齐差和代码质量塌方。 vibe coding 是临时手艺这套 skill 把 agent 推到生产级流程上

中文

5.2K

lee lion@euclid_lee·15 Nis

@dotey 我会推荐他用claude写

中文

112

宝玉@dotey·15 Nis

你的同学小明发现 DeepSeek 写作功能强大，便打算以后所有的作文都用它完成，不再自己动笔。你会怎样劝说他?

中文

250

179

155.1K

lee lion@euclid_lee·5 Nis

@scomper @karpathy 新知识有了，那旧知识呢

中文

105

Cheng@scomper·4 Nis

读完 @karpathy LLM 知识库工作流，也尝试清理了 Obsidian Clippings。核心洞察：LLM 不是问答机，是知识编译器。raw/ 丢资料 → LLM 增量编译成 Wiki（摘要+反链+归类）→ 查询结果写回，知识越用越厚。 #LLM #Obsidian

中文

8.9K

lee lion@euclid_lee·5 Nis

@yan5xu 感觉得有个自动进化的知识库，既能新增知识，也能对已有知识评判修改之前的记忆，感觉现在很多都是append，很少有update的

中文

894

yan5xu@yan5xu·5 Nis

最近一直在思考 Harness Engineering，架构约束、AGENTS.md、意图规范、自动化反馈回路，这些做法完全没问题，但总感觉有点模糊。后来发现，模糊不在做法本身，而是它没有说明白，它的出现是为了解决什么核心问题。 Agent 的协作有两个区间。Copilot 区间是人在 loop 的同步协作，你和 Agent 实时交互，每一步你都参与决策。Delegate 区间是人离开 loop 的异步委托，你把任务交出去，Agent 独立决策和执行，做完交回来验收。 Agent 能力在增长，能做的事越来越多，独立工作时间越来越长。一个跑几分钟的任务你可以盯着，一个跑两小时的任务你盯不住，也不应该盯。工作时间变长，你和 Agent 协作的方式就会自然地从 Copilot 区间滑入 Delegate 区间。但同步和异步的工作方式，带来的挑战完全不一样。同步模式下你实时参与，随时能给出上下文进行纠偏，容错成本很低。一旦变成异步，任务定义不清 Agent 就跑偏，过程中出了问题没人拦，验收时一堆东西堆在一起 review。导致在产品设计上就需要不一样的思路。所以核心矛盾是：Agent 因为能力增强，正在从同步模式转向异步模式。这种不可逆的趋势下，真正的题是怎么构建安全的异步委托机制，让这个转变可控。 Harness Engineering 就是在做这件事。它把整个系统反馈回路里的客观信号，编译器、类型检查、lint、测试、CI、线上日志、Sentry、可观测性平台，直接接到 Agent 面前，去掉人作为中间传递者的角色，让 Agent 自己读信号、自己闭环。但除了客观信号，还有主观信号。方向对不对，命名好不好，方案该不该推翻，用户真正想要的到底是什么。这些判断只存在于人的脑子里，环境中没有对应的信号源，Harness 再完善也接不进去一个不存在的东西。这是两个不同性质的问题。客观信号是工程问题，接上就行。主观信号是知识沉淀外化问题，它带来的是产品和技术上的双重设计挑战：如何让人或者组织自然、甚至无感地进行知识沉淀外化。难得多，但也是 Delegate 区间能不能真正持续扩大的关键。还有一个有意思的现象：我们构建的异步委托机制越完善，Agent 异步工作就越安全，人需要介入的地方就越少，Delegate 区间进一步扩大。Agent 能力的增长在推，基础设施的完善也在推，两股力同向，Delegate 只会越来越多。所以啊，今年会不会产品或者方法论，解决知识沉淀外化的问题呢🤔

中文

201

21.6K

lee lion@euclid_lee·2 Nis

现在很多cli出来了，如何把cli做成skill有什么好的起手式么

中文

lee lion@euclid_lee·29 Mar

@jakevin7 求攻克

日本語

162

kabikabi@jakevin7·28 Mar

twitter目前感觉应该是最好的平台之一了。在这上面学到了很多东西，也build in public了很多。 Thanks everyone

中文

268

19.4K

lee lion@euclid_lee·29 Mar

@jakevin7 我自己尝试逆向没找到

中文

201

lee lion@euclid_lee·29 Mar

@jakevin7 哥cli支持trae么

中文

193

lee lion@euclid_lee·27 Mar

harness具象化了

日本語

lee lion@euclid_lee·27 Mar

@runes_leo 哥你真狠

日本語

1.1K

Leo@runes_leo·27 Mar

给 Claude Code 装了 19 个抓网页的工具，结果最大的问题变成了：拿到一个链接，到底该用哪个？ xreach、Jina、Chrome MCP、Playwright、Apify、Scrapling……同一个需求经常有四五个能干，靠记忆选，选错就是一轮试错。今天装了个 web-access，CDP 直连日常 Chrome，零配置就能复用所有登录态。微信、小红书、知乎，不用再折腾 cookie 和模拟登录了。正好借这个机会把 19 个工具全盘了一遍，按场景排了张优先级表：读推文 → xreach 公开网页 → Jina 需要登录的站 → web-access（CDP 直连 Chrome）浏览器交互 → Chrome MCP 反爬 → Scrapling JS 重渲染 → Playwright 全都不行 → XCrawl 兜底写进路由规则，AI 自己按表选工具，拿到 URL 5 秒出结果，不再试错。

中文

467

63.8K

lee lion@euclid_lee·21 Mar

最近vibe了个基于无限画布和看板管理和tab管理一体的macos应用，基于worktree+gitdiff可以并发管理多个会话，并且能看到多个会话的流转情况，主要解决几个问题 1. 会话太多无法管理 2. 单一tab或者画布形式不太好管控 3. 同时控制发送多个会话，review后批准他们继续执行大家觉得有什么改进意见

中文

lee lion@euclid_lee·19 Mar

@jakevin7 这个生成各个平台的cli接口的方式，是有什么skill么，还是在开源的opencli里有用的地方

中文

588

kabikabi@jakevin7·18 Mar

opencli 支持 CLI 化所有 electron 应用！最强大更新来袭！ CLI all electron！现在支持把所有 electron 应用 CLI 化，这样可以组合各种神奇能力。我最近大量使用 Antigravity Ultra，虽然它量大但工具难用，并且不容易扩展。现在通过 OpenCLI 把他 CLI 化。 Claude 桌面版也是 electron，目前也可以支持哦！现在可以 AI 自己控制自己！自己驱动自己写代码！通过 cc/openclaw 远程控制任何 electron 应用! 无限玩法！！

中文

493

96.9K

lee lion@euclid_lee·13 Mar

这个思路非常好，有时候是我们限制了ai的生成，标准定的太低，让他有一个高标场景，他往往做的更好

0xTank | PopLab.AI@tankxu

这个 Skill 没啥用，实践下来目前 AI 生成 Logo 关键还是大量抽卡，提示词工程能起到的效果不大。我常用的方式很暴力，一张图里生成一批 Logo 而不是单个，把 Nano Banana、ChatGPT、即梦等能用的生图模型都用起来，让它们生成 Logo 墙，多次尝试获得一堆的方案，找到一个喜欢的图形再截出来继续加工。不过作为设计师我还是更喜欢直接在纸上画 Logo。举个例子，提示词“我要一个获得平面设计大奖的Logo展示墙，Logo设计主题是monkey”

中文

103

lee lion@euclid_lee·25 Şub

@yadong_xie 感觉代码作为上下文，在已有大项目上内容量太大了，更容易幻觉，尤其是多人维护，写了点脏东西，或者很多都不是关键信息，很多代码都是辅助一个核心方法写的，这种对AI的要求太高了。或者新项目都没有代码，spec说是规范，最终还是为这次prompt的session最优上下文服务，主要就是要那种指哪打哪的感觉

中文

183

Yadong Xie@yadong_xie·24 Şub

正确的使用 spec driven 有几个关键点： 1. 如何划分 scope 让 agent 在合理的 context 内能够并行工作 2. 如何设置合理的验收逻辑，让 agent 能够在合理循环内结束 3. 如何正确的设置 feedback loop，让 agent 能够在有限次数内收敛其实整个设计就是《自动控制原理》自动控制原理是研究在无人直接参与的情况下，通过控制装置使被控对象按预定规律运行的技术科学死去多年的自动化专业又在攻击我

Yadong Xie@yadong_xie

这篇文章建立在一个错误的假设前提下，code 会永远存在并且做为产品的 single source of truth 事实上的最后产品的 spec 才是 SoT，code 的角色最终会变成 bin 或者汇编 code 不是资产，spec 才是，每次有更好的模型就可以从 spec 获得更好的 code implement，而不是让 ai 在 code 的 shit mountain 上痛苦的理解产品的 spec

中文

15.8K

Keşfet

@fkysly @Lucy_love_AI @rwayne @dotey @scomper @karpathy @yan5xu @jakevin7