고정된 트윗
Ren
254 posts

Ren
@FakeMaidenMaker
🧠 First Principle Thinking 🔨 Build in Public 🤖 AI 开发者 📈 量化策略研究者 持续分享 AI/科技/投资/创业 领域干货内容
Virginia, USA 가입일 Mart 2025
150 팔로잉290 팔로워

好问题
Hermes 省token方面有很多机制:
1. 缓存优化:
hermes: 全session 缓存,缓存命中接近100%;
并且 Hermes 把外部记忆、plugin 上下文等临时内容塞到 user message 里而不是 system prompt,确保 system prompt 的 prefix cache 永远命中。
openclaw: 动态内容(heartbeat、group chat context、runtime info)会更改 cache boundary, 缓存打折扣
虽然不省 token 但是 cache 命中高 = 省钱
2. Comapction 增量更新(省的不多)
Hermes: 已有摘要时只 merge 新内容
openclaw: 每次 compact 重写摘要
3. 历史记录搜索方式(最省token的一集)
Hermes: FTS5(关键词搜索) 命中 → 加载匹配会话 → 截取 ~100K 字符 → 廉价模型摘要 → 精炼结果注入
OpenClaw: Hybrid:向量+BM25 搜索 → 返回 top N raw chunks → 直接注入主模型 Context
读取 raw chunk, token 开销大!
关于 skill 管理:
1. 能关
config 里有 creation_nudge_interval: 15 这个参数,每隔 x 轮对话自动判断是否有需要更新的 skill
设成 0 就禁用自动创建更新。
2. 如果太多了仍然还是要手动管理的
检测到已有相关skill会进行更新而不是无限创建。如果长期使用skill太多 ,允许用户通过 `skills.disabled` 禁用一些skill或者直接删除。
能用到 50+ 不同复杂流程被自动编写为skill的时候,相信你也是Master了。
黄赟@huangyun_122
感谢分享 这两点我有疑惑: 1/ 如果历史会话够长,Hermes 采用什么方式实现搜索,能比 OpenClaw 的压缩更快?而且能精确到减少 30-60% 的 Token 消耗。纯依靠大模型的缓存,肯定不是唯一解 2/ 自动生成 skill, 是否可以关掉?纯自动化会带来更多的 Token 消耗和后期的维护。如果不加以收敛,Skill 库会爆炸性膨胀。不知道 Hermes 对 Skill 生命周期怎么治理
中文

风口不是等来的
是那些胆子大的人先跳下去试出来的
17 年柯洁输给 AlphaGo
全网喊 AI 时代来了
如果那时你买了英伟达,到现在已经70倍了
你现在还在观望吗?
Ren@FakeMaidenMaker
中文

@shao__meng @CreaoAI @intuitiveml 说得好啊
每个人都应该培养自己的AI-原生思维;
所有团队反思自己的架构,自己的工作流是否是以 AI 为主要生产者来构建的。
如果不是,那么 AI 的效率再高,也往往会被组织架构的落后而被限制住。
中文

CEO/CTO/团队管理者们,给团队人手一个 AI 助手就自认为 AI-First 了?
@CreaoAI 联创/CTO @intuitiveml 的 "AI-First" 工程转型写的很有深度,推荐朋友们阅读。
AI-First ≠ 使用 AI !
大多数公司只是把 AI "塞进"到现有流程(AI-assisted),效率提升 10-20%,但结构未变。真正的 AI-First 是彻底重构流程、架构和组织,让 AI 成为主要构建者,人类负责方向和判断。
关键差异:从 "AI 如何帮助工程师"转向"如何重构一切让 AI 做构建,工程师做指导"——这是乘法效应 vs 加法效应的区别。
三大瓶颈与破局
· 产品管理:
· 传统模式:数周调研规划 → 2小时构建
· AI-First 模式:PM 转型为"产品架构师",用原型-测试-迭代循环替代文档评审
· QA测试:
· 传统模式:2小时构建 → 3天人工测试
· AI-First 模式:AI 构建测试平台,验证速度与实施速度匹配
· 人员规模:
· 传统模式:竞争对手100倍人力
· AI-First 模式:25人通过系统重设计实现产出对等
设计、实施、测试三个环节必须全链路 AI 化,任何单一环节保持人工都会成为新瓶颈。
技术架构:为 AI 可读性而设计
最激进的决策是统一为 Monorepo (@dotey 宝玉老师也强调过这一点) ——不是为了人类工程师方便,而是让 AI 能"看见"完整系统图景,进行跨服务推理和本地集成测试。
这也符合 OpenAI 提出的 "Harness Engineering":工程团队的首要任务不再是写代码,而是构建让 AI 有效工作的能力体系。当出错时,解决方案不是"更努力",而是"缺什么能力,如何让 AI 清晰理解和执行"。
技术栈详解:六层闭环系统
1. 基础设施层:AWS + CloudWatch(结构化日志,25+告警,AI 可查询)
↓
2. CI/CD 层:GitHub Actions(六阶段流水线,零手动覆盖)
↓
3. AI 代码审查:Claude Opus 4.6(三通道并行:质量/安全/依赖)
↓
4. 自愈反馈环:每日健康报告 → 错误聚类 → 自动工单 → 修复验证 → 自动关闭
↓
5. 功能管理:Statsig(功能开关 + A/B 测试 + 熔断回滚)
↓
6. 协作层:Graphite(PR 队列)+ Sentry(异常监控)+ Linear(人工界面)
新工程组织:两种角色
· 架构师(1-2人):设计 SOP、测试基础设施、系统边界、定义"好"的标准;要求深度批判思维,质疑 AI 提案,发现遗漏的失败模式和安全边界
· 操作员(其余人):调查验证、UI 精修、PR 审查风险;要求技能与注意力,无需传统架构推理能力
反直觉发现:初级工程师适应更快——没有十年习惯需要摒弃;资深工程师最难接受——两个月工作可被 AI 一小时完成。
变革后的成果数据
· 部署频率:14天内日均3-8次生产部署(旧模式两周无法完成一次发布)
· 决策速度:坏功能当天上线当天下线,新功能当天构思当天上线
· 质量指标:用户参与度、支付转化率均上升(反馈循环收紧带来的质量提升)
给我们的启发
· 对工程师:代码产出价值递减,决策质量价值递增。产品品味(Product Sense)和批判性思维成为核心技能。
· 对 CTO /创始人:
· 若 PM 流程耗时超过构建时间,先重构 PM 流程
· 扩展 AI 前必须先构建测试驾驭体系(快 AI+慢验证=快速技术债务)
· 从1个架构师开始,证明系统可行后再扩展
· 推动全职能 AI Native(工程、产品、市场、增长一体化)
· 对行业:Harness Engineering 正成为标准——结构化上下文、专业化 Agent、持久记忆、执行循环。模型能力是驱动时钟,Opus 4.5 到 4.6 的跃升促成了 CREAO 的整体转型。

Peter Pang@intuitiveml
中文

每个人都应该培养自己的AI-原生思维;
所有团队反思自己的架构,自己的工作流是否是以 AI 为主要生产者来构建的。
如果不是,那么 AI 的效率再高,也往往会被组织架构的落后而被限制住。
Peter Pang@intuitiveml
中文

@intuitiveml We should all actively cultivate AI-Native thinking.
Teams need to review their workflows and identify areas that are not AI-Native enough.
English













