
补充一个应用场景:Code Review。
Claude Code 已经发布了多 agent 并行的 Code Review 产品,但多 agent 的结构性弱点是跨模块 regression 检出——每个 agent 只看局部,缺乏对整个 PR 变更链的整体理解。
Turn-level compact 提供了另一条路径:单 agent 逐模块 review,每轮产出压缩为结构化摘要后继续下一模块,始终保持对已 review 部分的决策连续性。
用真实数据画一下优势区间:
中型 PR(10-30 文件,500-3k 行 diff):diff + 必要上下文约 20k-100k tokens,128K context 下一次性塞入已经紧张
大型 PR(30-100 文件,3k-10k 行):diff + 上下文轻松超 100k-500k,即使 1M context 也有压力
Review 产出压缩比约 8-20x:一轮 2k token 的详细 review → 100-250 token 的结构化摘要(文件、issue 数量、severity、关键决策),每轮释放约 1-4k tokens
这意味着在中型以上的 PR review 中,turn-level compact 让单 agent 能在一个 session 内完成多 agent 才能覆盖的代码量,同时保持跨文件的整体理解——跨模块 regression 正是需要这种整体理解才能检出的。
小型 PR 一次性塞入最优,不需要这个方案。超大型 PR 最终也会触发 compact,但触发点晚得多。核心优势区间在中到大型 PR——恰好是实际开发中 review 瓶颈最严重的区间。
跨文件 regression 检出率的量化对比(单 agent 多轮 vs 多 agent 并行)目前待验证,需要 controlled experiment。但从 decision continuity 的角度推导,单 agent 积累的上下文理解应该优于并行 agent 的事后聚合。
中文


