CoderBuffer

352 posts

CoderBuffer

CoderBuffer

@CoderBuf

full-stack engineer — dedicated to sharing insights on AI Stack, system architecture, technical R&D, cloud-native, and cloud computing DevOps

Beigetreten Ocak 2026
279 Folgt84 Follower
CoderBuffer retweetet
宝玉
宝玉@dotey·
推荐李继刚老师的系列技能: ljg-card 内容铸卡 将内容转为 PNG 视觉卡片(长图、信息图、海报)。信息图模式会根据内容密度、结构和情绪自动生成独特的视觉构图,没有固定模板,形式服务于内容。 ljg-learn 概念解剖 从八个方向切开一个概念(历史、辩证、现象、语言、形式、存在、美感、元反思),最后压成一句顿悟。输出 org-mode 文件。 ljg-paper 论文阅读器 为非学术人士提取论文中的想法,重理解不重批判 ljg-plain 白话引擎 把任何内容改写到聪明的十二岁小孩也能懂ljg-rank降秩引擎 — 给一个领域,找出背后真正撑着它的几根独立的力。现象砍到不可再少的生成器,砍完能把现象一个个生回来,才算数。 ljg-x-download X 媒体下载 将 X/Twitter 帖子中的图片和视频下载到 ~/Downloads ljg-skill-map 技能地图 扫描所有已安装技能,渲染可视化总览 ljg-word 英语单词精通 深度拆解一个英语单词的核心语义和顿悟时刻 ljg-writes 写作引擎 带着一个观点出发,在写的过程中把它想透 ljg-roundtable 圆桌讨论 以求真为目标的结构化多人辩证对话框架,主持人引导真实历史/当代人物进行多轮深度交锋,每轮生成 ASCII 思考框架图,最终输出知识网络。 ljg-travel 旅行研究 输入城市名,自动生成深度文化研究文档(org-mode)+ 便携卡片(PNG)。覆盖历史分层、博物馆重点、古建看点、考古发现,方法论借鉴考古学案头研究(DBA)。 工作流 工作流将多个技能串联为一个命令。 ljg-paper-flow ljg-paper → ljg-card读论文 + 做卡片一气呵成 ljg-word-flow ljg-word → ljg-card -i单词深度分析 + 信息图卡片一气呵成 ljg-travel Research → ContentAnalysis → ljg-card城市文明研究 + org文档 + 便携卡片一气呵成
宝玉 tweet media宝玉 tweet media
李继刚@lijigang

github.com/lijigang/ljg-s… 把「圆桌讨论」的skill 也添加进来了,以后归拢一下,把日常使用比较成熟的skill 都放在这个repo。

中文
6
91
495
64.9K
CoderBuffer retweetet
Ray Wang
Ray Wang@wangray·
Anthropic 新发的这篇多 Agent Harness 实践值得一读 借鉴 GAN(生成对抗网络)的思路,把 agent 拆成 Generator + Evaluator,解决两个关键问题: 1️⃣上下文焦虑:模型在长任务中越来越差,接近 context 上限时会匆忙收工。解法不是 compaction(压缩对话),而是 context reset——彻底清空,用结构化交接文件把状态传给新 agent 2️⃣自我评价失真:agent 评价自己的产出时永远觉得好。解法是把「做」和「评」分成两个 agent,然后把 evaluator 调成严格模式 两个实验👇 实验一:前端设计(Generator + Evaluator) - 定义了 4 个评分维度:设计质量、原创性、工艺、功能性 - 重点惩罚 "AI 味"(紫色渐变 + 白色卡片这种) - 跑 5-15 轮迭代,每轮 evaluator 用 Playwright 实际操作页面再打分 - 效果:第 10 轮出现了创造性飞跃——荷兰美术馆从普通暗色主题变成 CSS 3D 空间体验 实验二:全栈应用(Planner + Generator + Evaluator) - Planner:1-4 句话 → 完整产品 spec(故意不写技术细节,避免错误级联) - Generator:按 sprint 逐个实现功能 - Evaluator:用 Playwright 像真实用户一样点击测试,打分不过关就打回 给 AI 工程师的三条经验 1️⃣Evaluator 不是固定配置——当任务超出模型 solo 能力边界时才值得用 2️⃣Harness 的每个组件都编码了一个假设("模型做不好 X"),新模型出来要重新验证 3️⃣有趣的 harness 组合空间不会随模型进步而缩小,只会移动——工程师的工作是持续找到新的有效组合
Anthropic@AnthropicAI

New on the Anthropic Engineering Blog: How we use a multi-agent harness to push Claude further in frontend design and long-running autonomous software engineering. Read more: anthropic.com/engineering/ha…

中文
9
141
810
154.7K
CoderBuffer
CoderBuffer@CoderBuf·
现在的Agent一直在做加法,你的上下文越来越大,token消耗越来越快,钱包也越来越瘪,沉浸在自我的狂欢里
中文
0
0
0
4
CoderBuffer retweetet
Leo
Leo@runes_leo·
试了 @jolestar 的 webmcp-bridge,一下理解了这个方向的价值: 现在 AI 操作网页,本质是模拟人点击 —— 找按钮、算坐标、截图确认、反复重试。页面一改版就全废。 WebMCP 反过来:让网页应用主动告诉 AI「我能做什么」,AI 直接调用。不用模拟键鼠,不用找 DOM,一步到位。 从"被操控"到"主动服务",这才是 AI 和浏览器协作的正确方向。 PS:这张配图就是我用 AI 工具画出来的,全程无手动操作。
Leo tweet media
jolestar@jolestar

x.com/i/article/2033…

中文
9
15
116
25.1K
CoderBuffer retweetet
meng shao
meng shao@shao__meng·
ClawHub Skills 排名第一的「self-improving-agent」:记录经验、总结错误,形成持久化的经验记忆,提取成 Skills,自我提升,不断总结经验,这个 Skills 的设计理念真的很值得反复琢磨。 - 架构分为三层 - 第一层:日志采集 在项目根目录下建立 .learnings/ 目录,包含三类文件: · LEARNINGS.md:被用户纠正的错误认知、过时的知识、更优的做法 · ERRORS.md:命令执行失败、异常堆栈、意外行为 · FEATURE_REQUESTS.md:用户希望 Agent 具备但目前缺失的能力 每条记录采用统一的结构化格式:唯一 ID、时间戳、优先级、状态、涉及的代码区域、详细描述、建议修复方案,以及用于关联相似问题的 See Also 字段。 第二层:经验晋升 日志只是原始材料。当某条经验被验证为普遍适用——不是一次性的个案,而是跨文件、跨功能的通用规则——就应该"晋升"到更高层级的配置文件中: · CLAUDE.md / .github/copilot-instructions.md:项目级的事实和约定,所有 Agents 会话都会读取 · AGENTS.md:Multi Agents 协作的工作流规则 · SOUL.md:OpenClaw 行为准则和沟通风格 · TOOLS.md:工具使用的注意事项和已知坑点 晋升时要求提炼,不是把冗长的事故报告搬过去,而是压缩成简短的防御性规则。比如: > 原始记录:项目用 pnpm workspaces,我试了 npm install 结果失败了,锁文件是 pnpm-lock.yaml,必须用 pnpm install。 > 晋升后写入 CLAUDE.md:Package manager: pnpm (not npm) - use pnpm install 这个从"事故叙述"到"行为规则"的转化过程,是整个 Skills 最有价值的设计。 第三层:Skill 提取 当某条经验足够通用——不仅对当前项目有用,对其他项目也有参考价值——可以进一步提取为独立的 Skill。Skill 提供了一个 extract-skill. sh 脚本来辅助这个过程,支持 --dry-run 预览。 提取的门槛设得比较合理:需要有 2 个以上的关联条目(说明是反复出现的问题)、已验证的修复方案、非显而易见的知识点。 - 自动化机制 - Skills 提供了两个 Hook 脚本,通过 Agent 的钩子系统实现半自动化: · activator. sh(挂载在 UserPromptSubmit):每次用户发送消息后注入一段提醒,让 Agent 评估是否需要记录经验。开销约 50-100 tokens。 · error-detector. sh(挂载在 PostToolUse):监听 Bash 命令执行结果,当检测到非零退出码时触发记录流程。 - 循环模式检测 - Skills 专门设计了一套去重和升级机制来处理反复出现的同类问题: · 每条记录可以带 Pattern-Key(如 simplify.dead_code、harden.input_validation)作为稳定的去重键 · 同一 Pattern-Key 再次出现时,递增 Recurrence-Count,更新 Last-Seen · 当一个模式满足 出现 3 次以上 + 跨 2 个以上任务 + 30 天内 这三个条件时,自动触发晋升 这个量化的晋升规则避免了两个极端:过早晋升导致配置文件膨胀,或过晚晋升导致同样的错误不断重复。 - 多个 AI Agents 兼容性 - · Claude Code / Codex:通过 Hook 脚本激活 · OpenClaw:通过 Workspace 注入 + 会话间通信激活 · GitHub Copilot:手动写入 instructions OpenClaw 平台的集成最深,支持通过 sessions_send 在不同会话之间传递经验,这意味着一个会话踩过的坑可以实时通知到并行运行的其他会话。 Skills 安装地址 clawhub.ai/pskoett/self-i…
meng shao tweet media
中文
15
115
470
36.5K
CoderBuffer retweetet
阿绎 AYi
阿绎 AYi@AYi_AInotes·
做Agent开发的朋友们,AI skill的底层逻辑要变天了, 今天这个思路至少帮你省80%的维护时间。 之前我们做AI技能都是写死SKILL.md,改一次得手动迭代, 现在有个新范式:让技能自己观察自己的失败,自己迭代进化。 刚刷到cognee-skills的思路,点透了现在AI技能最大的痛点:你写的SKILL.md是静态的,但环境天天变,模型更新了、代码API变了、用户需求变了,技能偷偷失效了你都不知道。 我之前做AI工作流就踩过这个坑:某个技能跑了两个月好好的,突然开始疯狂报错,查了半天才发现第三方API改了返回格式,之前的静态prompt完全适配不上。 什么叫活的技能系统?五个核心步骤👇 #AI #Agent开发 #prompt工程
Vasilije@tricalt

x.com/i/article/2032…

中文
6
55
223
52K
CoderBuffer retweetet
Ding
Ding@dingyi·
多 agent 应用已经进化到这样了吗
中文
41
46
527
89.4K
CoderBuffer retweetet
开发者Hailey
开发者Hailey@IndieDevHailey·
阿里又开源了一个很绝的项目——PageAgent AI 可以直接操作网页。 它最打动我的一点是: 把最烦人的数据录入干掉了。 很多公司每天都在做这种重复工作: 复制数据 → 打开系统 → 填表 → 提交 以后可能只需要一句话: “帮我填写客户信息。” AI 就会自动识别网页结构,把整个流程全部做完。 几个非常实用的场景: 1. 自动填写网页 CRM 表单、注册表单、订单系统 直接让 AI 帮你把网页表单填好。 2. AI 网站助手(Web Copilot) 用户可以直接说: - 帮我找订单 - 生成报表 - 搜索商品 AI 自动在后台页面完成操作。 3. 企业系统自动化 ERP、CMS、内部管理系统 AI 可以直接操作后台 UI,把复杂流程自动化。 4. 无障碍辅助 语音 → 操作网页 用户说话就能完成网页操作。 和很多 Agent 不一样的是,它 不靠截图识别界面,而是直接读取 HTML DOM,所以: - 更快 - 更稳定 - 成本更低 而且整个系统 直接运行在浏览器里,不需要: - Puppeteer - Playwright - Python 自动化 相当于给网站装了一个 AI 操作员。 未来很多网站可能会变成这样: 用户不点按钮,而是直接和 AI 说话。
中文
31
217
899
83.9K
CoderBuffer retweetet
卡比卡比
卡比卡比@jakevin7·
CLI 宇宙继续!BOSS直聘 CLI! 我 CLI 都更新的很频繁,一定要记得更新版本 为了帮女朋友后面找工作,继续打造了这一个 CLI. 可以让 AI 直接操作它,然后进行筛选找到自己心仪的工作 还能让 AI 批发回复,批量投递 搜职位、看推荐、批量打招呼、导出 CSV,全部在命令行搞定。 并且完全都可以让 AI 全程帮你操作。帮你筛选,帮你做 自动提取浏览器 Cookie(10+ 浏览器) AI Agent 友好:--json 输出带 schema envelope 反风控:高斯抖动 + 自动退避 + Chrome 145 指纹 编号导航:boss show 3 直接看搜索结果第 3 个 GitHub: github.com/jackwener/boss…
卡比卡比 tweet media
中文
107
144
1.1K
179.3K
CoderBuffer retweetet
Chris Tate
Chris Tate@ctatedev·
agent-browser is now fully native Rust. The results: 1.6x faster cold start. 18x less memory. 99x smaller install. Less abstraction means faster shipping, more control, and capabilities that weren't possible before. Now with 140+ commands across navigation, interaction, state management, network control, debugging, and multi-engine support. It's become the tool we wished existed when we started building it. Thanks to everyone who reported issues, contributed fixes, and helped shape this release. More to come.
Chris Tate tweet media
English
128
155
2.4K
341.1K
CoderBuffer retweetet
Jack孔@Nano Labs(NA)🇭🇰
全球首家OpenClaw线下体验中心0.1版本正式上线
中文
54
12
133
43.3K
咸鱼9527
咸鱼9527@plzdontreconme·
30岁这一年,达成了24岁说要努力做到的一步,留念一下。
咸鱼9527 tweet media
中文
104
8
788
187.2K
CoderBuffer
CoderBuffer@CoderBuf·
@dotey 我也在也是正大光明摸鱼
中文
0
0
0
101
宝玉
宝玉@dotey·
以前程序员是等编译,现在是等生成
中文
52
52
569
96.3K
币圈福利哥
币圈福利哥@yyds123888·
500找了龙虾🦞上门安装,羡慕你们一学就会的人,我是看了几十个教程也没学会。
币圈福利哥 tweet media
中文
134
13
177
121K
BULLET
BULLET@nbe222·
中国は、秘密監視と偵察任務のために設計された蚊サイズのドローンを発表した。 昆虫飛行からインスパイアされたドローンは、超軽量素材、羽ばたき、マイクロエレクトロニクスを使用し、本物の昆虫の外観と動きを模倣しています。
BULLET tweet mediaBULLET tweet mediaBULLET tweet media
日本語
664
2.5K
13.1K
3.5M
Roland的思考日记
Roland的思考日记@rwayne·
在中国,想挣1000万,其实就三条路 1. 伺候100个有钱人 2. 服务1000个中产 3. 搞定1万个普通人 就这三条,没第四条
中文
130
261
2.2K
404.8K