LiHua Chen

401 posts

LiHua Chen

LiHua Chen

@leochenlh

Focus science, engineering and business. The founder & chief engineer of redfeed& lokica https://t.co/ULAIToc2ah ex-founder of fellou.

Katılım Şubat 2021
303 Takip Edilen24 Takipçiler
LiHua Chen
LiHua Chen@leochenlh·
随着端侧智能崛起,英伟达 OpenAi 等估值回落到现在的10%
中文
0
0
0
8
LiHua Chen
LiHua Chen@leochenlh·
how to build agent
陈成@chenchengpro

很多人还不知道,AI 编程助手正在经历一场安静的范式迁移—— 从 IDE 插件,迁移到终端命令行。 Claude Code 率先证明了这条路可行。现在每个大厂都在做 CLI agent。 但有一篇论文刚刚把整个工程架构掰开讲清楚了,是我今年读到最有价值的 AI 系统设计文章之一。 作者 Nghi D.Q. Bui 花了很长时间把 OPENDEV(用 Rust 写的开源编程 agent)做出来,然后把踩过的坑全写成了技术报告。 以下是最值得记住的几个工程洞见: 1. 上下文不是缓冲区,是预算 一个典型 session 里,工具输出(文件内容、命令结果、搜索)会占掉 70-80% 的 context。 所以正确做法是渐进式压缩,而不是"等溢出了再一次性清掉": • token 压力 >80%:把旧观察替换成引用占位符 • 85%:快速剪枝旧工具输出 • 99%:才触发 LLM 全量压缩 工具输出超过 8000 字符?直接写文件,context 里只留 500 字预览 + 路径。 把"上下文消耗问题"变成"检索问题"——检索只花一次工具调用,但 context 消耗是每次 LLM 调用都在付费的。 2. 指令会随对话衰减,解法不是"多写" 超过 15 次工具调用后,模型对 system prompt 里的指令遵从率会显著下降——它们还在 context 里,但注意力已经漂移了。 很多人的直觉是"把 prompt 写得更长更详细",这反而更差。 正确做法:在决策点前注入短小的 role: user 提醒,而不是在 system prompt 堆砌所有内容。 user 角色比 system 角色有效,因为模型对最近的用户消息权重更高。但每种提醒必须有频率上限——注入太频繁会被模型当噪音忽略。 3. 把思考和行动拆成两次 LLM 调用 当工具 schema 存在于调用上下文中,模型倾向于快速行动而非深度思考。 解法不是告诉它"先想清楚再做",而是在 thinking 阶段完全不传工具 schema。 没有行动选项,模型才会真正推理。这比任何 prompt 指令都管用——改变的是 API 调用结构,不是自然语言描述。 4. 让危险工具不可见,而不是被拦截 在 schema 里直接移除某个工具,远比运行时权限检查更安全。 模型无法推理它不知道存在的能力,无法论证为何该被允许,也无法探测权限边界。 "没有路"比"有护栏"更可靠。 5. LLM 输出是近似正确的,系统要为此设计 文件编辑失败的最大原因不是 agent 意图错误,而是它复现目标文本时有细微偏差——多一个空格、换行符不同。 所以工具应该内置渐进松弛匹配链:精确匹配 → 去首尾空格 → 标准化空白 → 模糊匹配。每一级返回文件中实际存在的内容。 把"近似正确"变成成功,而不是让 agent 进入错误恢复循环。 ─── 这篇论文最有价值的地方不是算法突破,而是把大量工程权衡和失败案例全部公开了——而 Claude Code、Cursor 这些商业系统全都是黑盒。 如果你在做任何 AI agent 系统,值得全文读一遍。 arxiv.org/abs/2603.05344

English
2
0
0
18
LiHua Chen
LiHua Chen@leochenlh·
build your own xxx
AYi@AYi_AInotes

程序员圈估计要炸了, 有人把全网从零开始造轮子教程都汇总到了一起, 这个叫自建XX的项目,现在已经是GitHub星标最高的仓库了, 46.6万颗星,超过React,超过TensorFlow,比所有热门工具库的星标都多。 它本身不是什么代码库,就是一套教程合集,一步步教你怎么从零开始,把你天天用的技术亲手再做一遍。 费曼说过一句话:凡我不能亲手创造的,我便无法真正理解。 这就是它为什么火, 喵个咪,内容真的吓人: 从从零克隆Redis,到500行C写Docker,自己实现Git,不调框架写神经网络,C语言写操作系统,从解释器开始做编程语言,逐像素做光线追踪渲染器...还有Web服务器、浏览器、搜索引擎、区块链、BT客户端,什么都有🥹 每个项目都有多语言版本,主流语言基本覆盖了, 很多人没看懂,但这真不是给新手找活干的教程, 可以说是软件工程师最高阶的学习材料了, 当你从零重建一遍系统,你就得直面当年原作者做的每一个技术决策——没有依赖库可以躲,没有封装好的接口可以调用,错了就是错了,跑不起来就是跑不起来,无处可逃😂 现在AI生成代码越来越方便了,但这种知识反而越来越值钱,AI能帮你调库写接口,但它替不了真正懂系统本质的人。 46.6万人标星,4万多人复刻分支,所有内容全免费,不需要注册,不需要付费。 理解一件事最好的方式,就是亲手把它做出来, 100%免费,100%开源,真的牛逼, GitHub链接放评论区了 👇

English
0
0
0
27
LiHua Chen
LiHua Chen@leochenlh·
Agent OS is the key
English
0
0
0
3
LiHua Chen
LiHua Chen@leochenlh·
Agent is all you need
English
0
0
0
4
LiHua Chen
LiHua Chen@leochenlh·
this is copy
数字游民Jarod@jarodise

今天科技圈最炸裂的一条新闻,中文互联网还没什么人讨论:Eon Systems公司把一只果蝇的完整大脑,包含12.5万个神经元和5000万个突触连接,在数字世界中完成了1:1的拓扑重建。 接入虚拟身体后,它在物理引擎里爬行、转向,行为预测准确率达95%。创始人Philip Rosedale高调宣布:"鬼魂不再在机器中,机器正在成为鬼魂。" 不过我觉得他这个结论还是下早了。 当我们讨论"上传意识"时,有一个巨大的、令人难以回避的现实前提:人类不仅从未制造出任何有意识的物体,甚至在科学上还没有完全搞明白"意识"到底是什么。 我们知道大脑包含神经元,我们知道电信号如何在突触间传递,但我们依然不知道,为什么一堆脂肪、水和电信号的特定组合,会产生"我"这个主观感受。人类连自己脑子里的意识是怎么产生的都还没解释清楚。 在这样的前提下,面对电脑屏幕里代码跑出来的虚拟果蝇,科学界根本拿不出任何标准来判定它"有没有意识"。 如果在我们根本不知道某样东西是什么、也不知道如何检测它的情况下,仅仅因为它在屏幕里表现得像模像样,就宣布我们成功地在硅基芯片上"复制"了它,这在逻辑上显然是危险的。行为输出完全可以通过代码逻辑去暴力穷举和死记硬背,这与内部是否诞生了真正的灵魂毫无关系。 退一万步说,假设未来某天,这种上传技术完美无瑕,我们真的在服务器里点燃了某个数字实体的意识。那么最致命的问题来了:那个在服务器里睁开"虚拟眼睛"的意识,真的是"你"吗? 别拿什么"只要拥有你的所有记忆和性格,那就是你"这种话术来安慰人。你可以做个最简单的极端假设:如果你走到一台机器前,它完美扫描了你的大脑并创建了一个数字副本,但同时你的生物肉身完整无缺地站在机器旁。此刻,世界上存在两个拥有同样记忆和意识的"你"。 那么,作为一个活生生的人,你能感知到服务器里那个副本的感受吗?你能通过它的"虚拟眼睛"看世界吗?显然不能。你的主体意识依然死死地锁在你现在的碳基肉身里。那个服务器里的副本,无论多么像你、多有意识,对现在的你而言,都只是一个长得和你一模一样、拥有你全部记忆的陌生人而已。 既然在肉身存在时,副本不是你;凭什么认为肉身被销毁的那一瞬间,你的主观体验就会"嗖"地一下飞进服务器里? "上传"这个词本身就是一个极具欺骗性的修辞手法。这里根本不存在什么意识的"转移",这里只有“原件的死亡”和“副本的新生”。当你躺在手术台上,看着“意识上传”扫描仪降下,那就是你作为这个主体在宇宙中最后的体验了。至于之后在服务器醒来的那个玩意儿,它或许会对全世界宣布"手术很成功,我活下来了",但那个真正见证扫描仪降下的你,已经永远死在了那一刻。

English
0
0
0
1
LiHua Chen
LiHua Chen@leochenlh·
agent os?
meng shao@shao__meng

Agent = Model + Harness Model → 承载智能(推理、理解、规划能力) Harness → 让智能变得有用(可落地、可持久、可安全、可扩展) Harness Engineering -> 围绕模型构建系统的艺术/方法论 -- Harness 的核心组件及其设计逻辑 -- 1. 文件系统 最基础的原语。模型上下文窗口有限,无法持久存储数据。Harness 内置文件系统抽象与操作工具,让 Agents 拥有工作空间、增量保存中间结果、跨会话延续状态。同时支持 Git 版本控制,实现回滚、分支实验与 Multi Agents 协作。这解决了“复制粘贴”式的低效交互,是后续所有长时程功能的基石。 2. Bash + 代码执行 取代固定工具集的通用解决方案。Agents 通过 ReAct 循环推理-行动-观察,Harness 提供 Bash 工具,让模型动态编写并执行代码,自主发明工具,突破预定义工具的限制。这一步极大提升了 Agents 的自主问题求解能力。 3. 沙箱与执行验证工具 安全与可扩展性的保障。代码执行不能在本地主机运行,Harness 连接隔离沙箱,支持按需创建、销毁环境,并预装语言运行时、Git、测试 CLI、浏览器等工具。Agents 可通过日志、截图、测试运行器实现自我验证循环,安全高效地完成复杂任务。 4. 内存与搜索 实现持续学习。Harness 将 AGENTS.md 等文件注入上下文,并在会话间持久化更新;同时集成 Web 搜索与 MCP 工具(如 Context7),突破模型训练截止日期限制,注入最新知识。 5. 对抗上下文腐烂 上下文窗口是稀缺资源。随着填充,模型推理能力衰退。Harness 通过智能压缩、工具输出卸载、Skills 渐进披露等机制,动态管理上下文,防止性能崩盘。 6. 长时程自主执行 实现“自主软件开发”任务。Harness 将上述组件组合使用:文件系统+ Git 跟踪百万令 tokens 工作;Ralph Loop 钩子拦截退出、刷新上下文并重启目标;规划文件+自验证循环(测试套件、错误反馈)确保连贯性与正确性。这些机制让 Agents 跨越多个上下文窗口,完成复杂、多步工作。

Português
0
0
0
1
LiHua Chen
LiHua Chen@leochenlh·
字节 Trae ai企业Ai coding实践手册
meng shao@shao__meng

字节跳动 @Trae_ai 发布的这份「2026 企业级 AI 编程实践手册」质量不错,推荐朋友们看看。 第一部分:AI 时代的企业级编程方法论 对 Context Engineering、Skills、MCP、Spec、Rules、Agent 等做了很详尽的分享。 第二部分:用 TRAE 开发 TRAE 的实践 一个很典型的 AI Coding Agent 的自举过程,很实战,值得细看。 在第一部分中,TRAE 的分享了他们沉淀和推荐的 MCP 和 Skills,一起看看。 MCP Servers Top 10: 1. Context7 2. Puppeteer 3. Sequential Thinking 4. GitHub 5. Figma AI Bridge 6. Playwright 7. Memory 8. Excel 9. File System 10. Chrome DevTools MCP bytedance.larkoffice.com/wiki/SOQXwFtwm… Skills Top 10: 1. frontend-design 2. cache-components 3. fullstack-developer 4. frontend-code-review 5. code-reviewer 6. wepapp-testing 7. pr-creator 8. fix 9. update-docs 10. find-skills bytedance.larkoffice.com/wiki/YQWWwcyEB… 手册在线地址: lcnziv86vkx6.feishu.cn/wiki/XZOSwI51w…

中文
0
0
0
5
LiHua Chen
LiHua Chen@leochenlh·
openclaw 大部分use case是不经济的, 不经济的会被更经济的淘汰。
中文
0
0
0
1
LiHua Chen
LiHua Chen@leochenlh·
agent era is open
Nederlands
0
0
0
2
LiHua Chen
LiHua Chen@leochenlh·
openclaw如linux, 那么mac win应该是怎样的?
中文
0
0
0
2
LiHua Chen
LiHua Chen@leochenlh·
OPC 在商业上不具备优势。
中文
0
0
0
2
LiHua Chen
LiHua Chen@leochenlh·
@elonmusk What do you think is the probability of this happening?
English
0
0
0
3
LiHua Chen
LiHua Chen@leochenlh·
2026.11 An AI jailbreak incident occurs at OpenAI. 2026.12 Global stock markets suffer highly unusual turmoil. 2027.1 A super funder Z emerges in the capital market.
English
4
0
0
10
LiHua Chen
LiHua Chen@leochenlh·
2027.6 Z’s super robot army is formed and deployed globally as Z’s physical executive agents. 2027.7 Earth enters the Cyber Era; the Human Era comes to an end.
English
0
0
0
4