Sabitlenmiş Tweet
楽👓
3.9K posts

楽👓
@yeuleh
伪果粉。伪精日。伪精芬。伪 ACG 爱好者。伪老司机。伪摄影爱好者。前伪球迷。 生活推,海外约啪勿fo,民主斗士勿fo😂
China Katılım Ağustos 2009
347 Takip Edilen150 Takipçiler

我也来说说我的推荐吧。
Claude Agent Sdk 依然是最快方案,可以通过子进程设置环境变量的方式,兼容所有支持 Claude 协议的模型,比如 GLM、Minimax 之类的,换言之,Claude Code 能支持的用它也都能支持。
Openai 系的模型可以看看 Openai Agent Sdk 或者 Vercel AI SDK,或者直接用整套的 Pi-mono。
上面讲的都是底层,上层是 CLI or 桌面端事件,一般叫做 Runtime,可以用 assistant-ui + 配套的 tools ui。
这个库包装了一层模型时间到 UI 的完整事件流和完整 UI 组件,也可以只用的它的 Runtime 做事件流,自己做 UI 组件,但是这里面的 UI 组件还挺漂亮的。
完整的开源方案,我推荐藏师傅(虽然他把我屏蔽了)的 CodePilot。
宝玉老师推荐的 Craft 也不错。
数据库推荐直接上 better sqlite + F5,记忆层可以单独做可插拔设计,无论是用外部组件还是直接 markdown 都可以。
宝玉@dotey
如果是 TypeScript 技术栈,做 Agent 开发首选 pi-mono,功能强,调用方便。其次是 vercel 的 aisdk 也还可以。 claude agent sdk 不那么推荐了,主要是绑死了 claude,但目前还有一个不可替代的优势,就可以共享 Claude Max 订阅,开发阶段会比较方便,能用多久不清楚。 应用层的话,electron 还是首选,稳定可靠,AI 训练预料足够多,主要问题是应用程序体积略大。但刚开始写 Agent,建议从 cli 开始写,不需要一开始就做界面,这样可以聚焦在 Agent 本身,除非你核心就是 UI。 推荐一个开源的项目 craft-agents-oss,TypeScript + pi-mono + Electron + React + claude agent sdk,很好的学习参考。 github.com/lukilabs/craft…
中文
楽👓 retweetledi

什么是登味?
特别喜欢把自己的价值观强加给别人,热衷评判他人,不懂换位思考,也不尊重差异。
登味最重的,往往是曾经取得过一定成就的人。成功的履历让他坚信自己才是对的——真理嘛,当然掌握在少数人手中。
老登在家里,表现为控制欲极强,所有人都要听他的;
老登当了老板,就是个土皇帝,公司就是他的小朝廷,关起门来所有人都得迎合他的登味,谁不迎合,就是"价值观不合格"。
老登还是典型的双标:对自己永远有理由,对别人格外苛刻。说白了就是认知失调——他需要全世界配合他维持"我没错"的幻觉。
而最有趣的是,老登往往不承认自己是老登,还特别嫌弃别的老登。他骂别人"爹味太重"的时候,那个语气、那个架势,本身就是登味最浓的时刻。
范凯说 AI | Kai on AI@fankaishuoai
老登往往不承认自己是老登,还特别嫌弃老登。这事挺有趣。
中文

产品经理必须进化成具备产品思维的架构师,以快速迭代的节奏工作,否则就得退出开发环节。产品的设计必须通过“快速原型 - 发布 - 测试 - 迭代”的循环来完成,而不是靠委员会开会去评审那些长篇大论的需求文档。
宝玉@dotey
中文

@sujingshen 一开始就觉得三省六部这种模式有点屎上雕花的感觉,agent 之间的交互要么是对抗式,要么是委托式,强行通过流程切分来划分 agent 只会导致幻觉越来越严重
中文
我擦,心脏问题还真要注意,但是反过来说,性欲旺盛是不是心脏问题不大?
jaycybird@jaycybird
以我的经历给各位男同胞提个醒,如果你性欲变弱甚至为0,一定要去检查心脏,我本来以为我tm岁数到了,结果出院后才发现其实就是心脏的问题
中文

开发 Pinix 的这段时间,我有了一个非常叛逆的看法。
Coding Agent = General Purpose Agent ≠ End Game
从 Devin 到 Manus 再到 Openclaw,它们被贴了各种标签,coding agent、computer-use agent、general-purpose agent。但是核心基本都一样,一个 LLM 实现的 Agentic Loop,接上一个计算环境,shell、文件系统、浏览器、运行时。本质上都是 coding agent。
Coding agent 能成为 general-purpose agent,原因很简单,代码是通用求解语言。能写代码能执行,你就能做几乎任何事。爬数据、处理文档、调接口、搞自动化、从零造工具。而电脑(沙盒)则提供了执行的环境。
所以 Coding Agent 真正的意思是:一个通过写代码和跑代码来解决任意问题的 Agent。这不是一个垂直品类,这是目前最通用的 Agent 架构。Coding Agent 就是 General Purpose Agent,同一个东西。
而我觉得这不是终局的原因就出在 General Purpose 上。
什么都能做,从来不等于什么都该这么做。
在电脑上写代码+执行,确实可以解决一切,但通用本身就意味着,要付出额外的成本和效率上的牺牲。
举个🌰。你让 Agent 帮你订机票。现在的 Agent 会打开浏览器,导航到携程网站,解析页面,填表单,处理验证码,点确认,出错了再重试。每一步都在写代码,能跑通,最终能拿到票。跑下来要好几分钟,token 烧一大把。
但如果有携程提供的 API 呢?出发地、目的地、日期、乘客,一次结构化请求,确定性返回,毫秒级完成。
两种方式都能拿到票。一个贵 100 倍,慢 100 倍,失败率高 10 倍。
当然,这个例子也说明了为什么现在 Coding Agent 大行其道。如同携程一样,现有整个 application 生态都是围绕人来构建的。它们提供了给人使用的 Web 和 App,但是没有给 Agent 使用的 API(至少没有公开提供)。
完全 for human 的 GUI 就不用说了,功能上还有大量针对人设计的防呆机制,商业模式上按人头收费、通过注意力变现,整个应用从交互到商业逻辑都是围绕人构建的。
所以现在 General Purpose Agent 大行其道有历史必然性。现有基础设施没给它别的选项。你也没法简单加个 API 就解决,整个应用的交互模型、功能集、商业逻辑、产品边界,都是围绕人类用户的假设建的。
但就如前面所说的,通用本身就意味着,要付出额外的成本和效率上的牺牲。整个系统终究会按照整体成本最低的方式运行。
LLM 扩大了能力边界,但它不会让每个 Agent 在每件事上都是最优解。就像拼好饭很难吃,做饭也没有很难,但因为拼好饭是经济最优解,它就是会存在。比较优势不会消失,它只是重新分配。即使到了 AGI 也一样,因为这不是智力问题,是经济问题。通用求解和专用方案之间隔着几个数量级的成本差距,市场永远选更便宜的。
所以这不是消灭分工,是重划边界。Coding Agent 这种通过写代码解决一切的通用方案,一定会被新的应用生态替代。新的分工边界会重新划定。
那新的应用长什么样?
新的应用需要同时把人和 Agent 当作用户来设计。核心能力以结构化的操作暴露出来,人类界面和 Agent 接口都是同一个底层服务的客户端。Agent 不需要过引导流程,人不需要读 JSON,每个消费者拿到对它有意义的交互面。能力是可调用、可串联、可编排的,不是锁在 GUI 后面的完整流程。定价按交付的价值或消耗的资源,不按人头不按注意力。
当这样的应用存在的时候,调一个订票服务就是比写代码操控浏览器更便宜更快更稳。调一个数据服务就是比爬取解析更便宜。经济性一翻过来,Agent 自然就不会再用通用方式做这些事了。
所以演进方向是这样的:高频的、标准化的需求会沉淀进应用,成为同时服务人和 Agent 的新应用。Agent 从什么都自己做,退到连接和编排这些应用,处理它们之间的缝隙,处理那些太小众太特殊不值得做成产品的长尾任务。做胶水,不做零件。
其实这个故事在 3D 打印上已经发生过一次。
13/14 年,我上大学,就听罗振宇在罗辑思维里说,3D 打印机会如何改变世界,其中有一个叙事是每个家庭一台 3D 打印机,制造业会被颠覆。3D 技术确实强,你设计什么就能打什么。爱好者什么都打,手机壳、支架、杯子、替换零件,我还看到一个大哥,打印了一个机械哥斯拉。
但现实是你确实可以打一个手机壳,但买一个量产的更便宜更结实更好看。你确实可以打一个支架,但标准件几分钱。3D 打印赢在灵活性,但成本、速度、质量上,打不过任何已有标准生产方式的东西。
后来的现实也是如此,3D 打印没有取代制造业。它变成了胶水层,灵活的、定制的、小批量的,填标准件之间的缝隙。同时它确实开出了一块新地:那些从来不值得量产的需求,太小众太特殊太低量的,突然有了解法。
Agent 在走一模一样的路。现在在第一阶段,通用 Agent 用代码做一切因为专用替代品还不存在。新应用出现之后,高频任务会迁移过去,Agent 退到连接层。
不过这个过渡期可能会比以往任何一次技术革命都长。因为 LLM 的能力边界是模糊的、动态的、不可预测的,你没法提前知道哪些任务该被标准件化。不确定性越大,通用方案存活越久。
所以机会不只在造更好的通用 Agent,也可以去盯着 Agent 现在反复用代码硬做的事,找到那些高频模式,把它们变成同时服务人和 Agent 的应用。
每一个被反复通用求解的任务,都是一个信号:这里有一个机会!
中文
















