CoderBuffer

352 posts

CoderBuffer

@CoderBuf

full-stack engineer — dedicated to sharing insights on AI Stack, system architecture, technical R&D, cloud-native, and cloud computing DevOps

Beigetreten Ocak 2026

279 Folgt84 Follower

Angehefteter Tweet

CoderBuffer@CoderBuf·1 Mar

刚开蓝V，迁一篇同名公众号文章，windows系统用户可以看看，虽然感觉X上mac os用户应该居多……

CoderBuffer@CoderBuf

x.com/i/article/2027…

中文

291

CoderBuffer retweetet

宝玉@dotey·3d

推荐李继刚老师的系列技能： ljg-card 内容铸卡将内容转为 PNG 视觉卡片（长图、信息图、海报）。信息图模式会根据内容密度、结构和情绪自动生成独特的视觉构图，没有固定模板，形式服务于内容。 ljg-learn 概念解剖从八个方向切开一个概念（历史、辩证、现象、语言、形式、存在、美感、元反思），最后压成一句顿悟。输出 org-mode 文件。 ljg-paper 论文阅读器为非学术人士提取论文中的想法，重理解不重批判 ljg-plain 白话引擎把任何内容改写到聪明的十二岁小孩也能懂ljg-rank降秩引擎 — 给一个领域，找出背后真正撑着它的几根独立的力。现象砍到不可再少的生成器，砍完能把现象一个个生回来，才算数。 ljg-x-download X 媒体下载将 X/Twitter 帖子中的图片和视频下载到 ~/Downloads ljg-skill-map 技能地图扫描所有已安装技能，渲染可视化总览 ljg-word 英语单词精通深度拆解一个英语单词的核心语义和顿悟时刻 ljg-writes 写作引擎带着一个观点出发，在写的过程中把它想透 ljg-roundtable 圆桌讨论以求真为目标的结构化多人辩证对话框架，主持人引导真实历史/当代人物进行多轮深度交锋，每轮生成 ASCII 思考框架图，最终输出知识网络。 ljg-travel 旅行研究输入城市名，自动生成深度文化研究文档（org-mode）+ 便携卡片（PNG）。覆盖历史分层、博物馆重点、古建看点、考古发现，方法论借鉴考古学案头研究（DBA）。工作流工作流将多个技能串联为一个命令。 ljg-paper-flow ljg-paper → ljg-card读论文 + 做卡片一气呵成 ljg-word-flow ljg-word → ljg-card -i单词深度分析 + 信息图卡片一气呵成 ljg-travel Research → ContentAnalysis → ljg-card城市文明研究 + org文档 + 便携卡片一气呵成

李继刚@lijigang

github.com/lijigang/ljg-s… 把「圆桌讨论」的skill 也添加进来了，以后归拢一下，把日常使用比较成熟的skill 都放在这个repo。

中文

495

64.9K

CoderBuffer retweetet

Ray Wang@wangray·4d

Anthropic 新发的这篇多 Agent Harness 实践值得一读借鉴 GAN（生成对抗网络）的思路，把 agent 拆成 Generator + Evaluator，解决两个关键问题： 1️⃣上下文焦虑：模型在长任务中越来越差，接近 context 上限时会匆忙收工。解法不是 compaction（压缩对话），而是 context reset——彻底清空，用结构化交接文件把状态传给新 agent 2️⃣自我评价失真：agent 评价自己的产出时永远觉得好。解法是把「做」和「评」分成两个 agent，然后把 evaluator 调成严格模式两个实验👇 实验一：前端设计（Generator + Evaluator） - 定义了 4 个评分维度：设计质量、原创性、工艺、功能性 - 重点惩罚 "AI 味"（紫色渐变 + 白色卡片这种） - 跑 5-15 轮迭代，每轮 evaluator 用 Playwright 实际操作页面再打分 - 效果：第 10 轮出现了创造性飞跃——荷兰美术馆从普通暗色主题变成 CSS 3D 空间体验实验二：全栈应用（Planner + Generator + Evaluator） - Planner：1-4 句话 → 完整产品 spec（故意不写技术细节，避免错误级联） - Generator：按 sprint 逐个实现功能 - Evaluator：用 Playwright 像真实用户一样点击测试，打分不过关就打回给 AI 工程师的三条经验 1️⃣Evaluator 不是固定配置——当任务超出模型 solo 能力边界时才值得用 2️⃣Harness 的每个组件都编码了一个假设（"模型做不好 X"），新模型出来要重新验证 3️⃣有趣的 harness 组合空间不会随模型进步而缩小，只会移动——工程师的工作是持续找到新的有效组合

Anthropic@AnthropicAI

New on the Anthropic Engineering Blog: How we use a multi-agent harness to push Claude further in frontend design and long-running autonomous software engineering. Read more: anthropic.com/engineering/ha…

中文

141

810

154.7K

CoderBuffer@CoderBuf·19 Mar

现在的Agent一直在做加法，你的上下文越来越大，token消耗越来越快，钱包也越来越瘪，沉浸在自我的狂欢里

中文

CoderBuffer retweetet

宝玉@dotey·16 Mar

x.com/i/article/2033…

ZXX

105

410

50.5K

CoderBuffer retweetet

Leo@runes_leo·16 Mar

试了 @jolestar 的 webmcp-bridge，一下理解了这个方向的价值：现在 AI 操作网页，本质是模拟人点击 —— 找按钮、算坐标、截图确认、反复重试。页面一改版就全废。 WebMCP 反过来：让网页应用主动告诉 AI「我能做什么」，AI 直接调用。不用模拟键鼠，不用找 DOM，一步到位。从"被操控"到"主动服务"，这才是 AI 和浏览器协作的正确方向。 PS：这张配图就是我用 AI 工具画出来的，全程无手动操作。

jolestar@jolestar

x.com/i/article/2033…

中文

116

25.1K

CoderBuffer retweetet

meng shao@shao__meng·16 Mar

ClawHub Skills 排名第一的「self-improving-agent」：记录经验、总结错误，形成持久化的经验记忆，提取成 Skills，自我提升，不断总结经验，这个 Skills 的设计理念真的很值得反复琢磨。 - 架构分为三层 - 第一层：日志采集在项目根目录下建立 .learnings/ 目录，包含三类文件： · LEARNINGS.md：被用户纠正的错误认知、过时的知识、更优的做法 · ERRORS.md：命令执行失败、异常堆栈、意外行为 · FEATURE_REQUESTS.md：用户希望 Agent 具备但目前缺失的能力每条记录采用统一的结构化格式：唯一 ID、时间戳、优先级、状态、涉及的代码区域、详细描述、建议修复方案，以及用于关联相似问题的 See Also 字段。第二层：经验晋升日志只是原始材料。当某条经验被验证为普遍适用——不是一次性的个案，而是跨文件、跨功能的通用规则——就应该"晋升"到更高层级的配置文件中： · CLAUDE.md / .github/copilot-instructions.md：项目级的事实和约定，所有 Agents 会话都会读取 · AGENTS.md：Multi Agents 协作的工作流规则 · SOUL.md：OpenClaw 行为准则和沟通风格 · TOOLS.md：工具使用的注意事项和已知坑点晋升时要求提炼，不是把冗长的事故报告搬过去，而是压缩成简短的防御性规则。比如： > 原始记录：项目用 pnpm workspaces，我试了 npm install 结果失败了，锁文件是 pnpm-lock.yaml，必须用 pnpm install。 > 晋升后写入 CLAUDE.md：Package manager: pnpm (not npm) - use pnpm install 这个从"事故叙述"到"行为规则"的转化过程，是整个 Skills 最有价值的设计。第三层：Skill 提取当某条经验足够通用——不仅对当前项目有用，对其他项目也有参考价值——可以进一步提取为独立的 Skill。Skill 提供了一个 extract-skill. sh 脚本来辅助这个过程，支持 --dry-run 预览。提取的门槛设得比较合理：需要有 2 个以上的关联条目（说明是反复出现的问题）、已验证的修复方案、非显而易见的知识点。 - 自动化机制 - Skills 提供了两个 Hook 脚本，通过 Agent 的钩子系统实现半自动化： · activator. sh（挂载在 UserPromptSubmit）：每次用户发送消息后注入一段提醒，让 Agent 评估是否需要记录经验。开销约 50-100 tokens。 · error-detector. sh（挂载在 PostToolUse）：监听 Bash 命令执行结果，当检测到非零退出码时触发记录流程。 - 循环模式检测 - Skills 专门设计了一套去重和升级机制来处理反复出现的同类问题： · 每条记录可以带 Pattern-Key（如 simplify.dead_code、harden.input_validation）作为稳定的去重键 · 同一 Pattern-Key 再次出现时，递增 Recurrence-Count，更新 Last-Seen · 当一个模式满足出现 3 次以上 + 跨 2 个以上任务 + 30 天内这三个条件时，自动触发晋升这个量化的晋升规则避免了两个极端：过早晋升导致配置文件膨胀，或过晚晋升导致同样的错误不断重复。 - 多个 AI Agents 兼容性 - · Claude Code / Codex：通过 Hook 脚本激活 · OpenClaw：通过 Workspace 注入 + 会话间通信激活 · GitHub Copilot：手动写入 instructions OpenClaw 平台的集成最深，支持通过 sessions_send 在不同会话之间传递经验，这意味着一个会话踩过的坑可以实时通知到并行运行的其他会话。 Skills 安装地址 clawhub.ai/pskoett/self-i…

中文

115

470

36.5K

CoderBuffer retweetet

PANews丨APP全面升级@PANews·16 Mar

Anthropic 出了第一个官方 AI 认证：Claude Certified Architect（CCA）专注考系统架构设计，能不能构建生产级应用，考试全程监考。缩写是 CCA，确实能跟 CFA 并排写在简历上 👀

PANews丨APP全面升级@PANews

x.com/i/article/2033…

中文

31.2K

CoderBuffer@CoderBuf·17 Mar

对我有用

axiaisacat@axiaisacat

很多技术创始人不是不会做产品，而是死在“没人知道你做了什么”。刚看到一个 GitHub 仓库 Marketing-for-Founders，有点像把“0 到 1000 用户”的冷启动打法，直接整理成了开源作战手册。这个仓库现在大约有 4.7k stars，定位也很直接：帮 SaaS / App / Startup 拿到前 10 / 100 / 1000 个用户。它最有价值的地方，不是讲那种“大预算做到百万 ARR”的故事，而是专门写给技术型创始人：没预算，没增长团队，怎么找第一批用户，怎么做 GTM，怎么把营销拆成能执行的动作更狠的是，它不是空谈。里面直接按主题整理了 launch 平台、Product Hunt、社媒、冷启动外联、SEO、LLM SEO / AEO / GEO、Reddit、邮件营销、内容营销、定价、转化率优化、用户研究这些实操资源。我越来越认同一件事：独立开发者最大的误区，不是产品做得不够好，而是把“增长”误解成“等别人发现”。不会营销的创始人，本质上是在把产品交给随机流量审判。如果你正在做 SaaS、AI 工具或 side project，这个仓库很值得收藏。👇

中文

CoderBuffer retweetet

阿绎 AYi@AYi_AInotes·14 Mar

做Agent开发的朋友们，AI skill的底层逻辑要变天了，今天这个思路至少帮你省80%的维护时间。之前我们做AI技能都是写死SKILL.md，改一次得手动迭代，现在有个新范式：让技能自己观察自己的失败，自己迭代进化。刚刷到cognee-skills的思路，点透了现在AI技能最大的痛点：你写的SKILL.md是静态的，但环境天天变，模型更新了、代码API变了、用户需求变了，技能偷偷失效了你都不知道。我之前做AI工作流就踩过这个坑：某个技能跑了两个月好好的，突然开始疯狂报错，查了半天才发现第三方API改了返回格式，之前的静态prompt完全适配不上。什么叫活的技能系统？五个核心步骤👇 #AI #Agent开发 #prompt工程

Vasilije@tricalt

x.com/i/article/2032…

中文

223

52K

CoderBuffer@CoderBuf·14 Mar

Nice,so cool

Chris Tate@ctatedev

json-render now supports YAML as a wire format JSONL needs a full element before rendering YAML is valid at every prefix, going from element-level to property-level 💨 YAML looks like source code to LLMs And we use 3 standards they know: JSON Patch, Merge Patch, Unified diff

English

CoderBuffer retweetet

Ding@dingyi·14 Mar

多 agent 应用已经进化到这样了吗

中文

527

89.4K

CoderBuffer retweetet

开发者Hailey@IndieDevHailey·13 Mar

阿里又开源了一个很绝的项目——PageAgent AI 可以直接操作网页。它最打动我的一点是：把最烦人的数据录入干掉了。很多公司每天都在做这种重复工作：复制数据 → 打开系统 → 填表 → 提交以后可能只需要一句话： “帮我填写客户信息。” AI 就会自动识别网页结构，把整个流程全部做完。几个非常实用的场景： 1. 自动填写网页 CRM 表单、注册表单、订单系统直接让 AI 帮你把网页表单填好。 2. AI 网站助手（Web Copilot）用户可以直接说： - 帮我找订单 - 生成报表 - 搜索商品 AI 自动在后台页面完成操作。 3. 企业系统自动化 ERP、CMS、内部管理系统 AI 可以直接操作后台 UI，把复杂流程自动化。 4. 无障碍辅助语音 → 操作网页用户说话就能完成网页操作。和很多 Agent 不一样的是，它不靠截图识别界面，而是直接读取 HTML DOM，所以： - 更快 - 更稳定 - 成本更低而且整个系统直接运行在浏览器里，不需要： - Puppeteer - Playwright - Python 自动化相当于给网站装了一个 AI 操作员。未来很多网站可能会变成这样：用户不点按钮，而是直接和 AI 说话。

中文

217

899

83.9K

CoderBuffer retweetet

卡比卡比@jakevin7·14 Mar

CLI 宇宙继续！BOSS直聘 CLI! 我 CLI 都更新的很频繁，一定要记得更新版本为了帮女朋友后面找工作，继续打造了这一个 CLI. 可以让 AI 直接操作它，然后进行筛选找到自己心仪的工作还能让 AI 批发回复，批量投递搜职位、看推荐、批量打招呼、导出 CSV，全部在命令行搞定。并且完全都可以让 AI 全程帮你操作。帮你筛选，帮你做自动提取浏览器 Cookie（10+ 浏览器） AI Agent 友好：--json 输出带 schema envelope 反风控：高斯抖动 + 自动退避 + Chrome 145 指纹编号导航：boss show 3 直接看搜索结果第 3 个 GitHub: github.com/jackwener/boss…

中文

107

144

1.1K

179.3K

CoderBuffer retweetet

Chris Tate@ctatedev·14 Mar

agent-browser is now fully native Rust. The results: 1.6x faster cold start. 18x less memory. 99x smaller install. Less abstraction means faster shipping, more control, and capabilities that weren't possible before. Now with 140+ commands across navigation, interaction, state management, network control, debugging, and multi-engine support. It's become the tool we wished existed when we started building it. Thanks to everyone who reported issues, contributed fixes, and helped shape this release. More to come.