Lesprivilege

7 posts

Lesprivilege banner
Lesprivilege

Lesprivilege

@lesprivilege

白雲回望合,青靄入看無。

انضم Aralık 2021
368 يتبع12 المتابعون
Lesprivilege
Lesprivilege@lesprivilege·
补充一个应用场景:Code Review。 Claude Code 已经发布了多 agent 并行的 Code Review 产品,但多 agent 的结构性弱点是跨模块 regression 检出——每个 agent 只看局部,缺乏对整个 PR 变更链的整体理解。 Turn-level compact 提供了另一条路径:单 agent 逐模块 review,每轮产出压缩为结构化摘要后继续下一模块,始终保持对已 review 部分的决策连续性。 用真实数据画一下优势区间: 中型 PR(10-30 文件,500-3k 行 diff):diff + 必要上下文约 20k-100k tokens,128K context 下一次性塞入已经紧张 大型 PR(30-100 文件,3k-10k 行):diff + 上下文轻松超 100k-500k,即使 1M context 也有压力 Review 产出压缩比约 8-20x:一轮 2k token 的详细 review → 100-250 token 的结构化摘要(文件、issue 数量、severity、关键决策),每轮释放约 1-4k tokens 这意味着在中型以上的 PR review 中,turn-level compact 让单 agent 能在一个 session 内完成多 agent 才能覆盖的代码量,同时保持跨文件的整体理解——跨模块 regression 正是需要这种整体理解才能检出的。 小型 PR 一次性塞入最优,不需要这个方案。超大型 PR 最终也会触发 compact,但触发点晚得多。核心优势区间在中到大型 PR——恰好是实际开发中 review 瓶颈最严重的区间。 跨文件 regression 检出率的量化对比(单 agent 多轮 vs 多 agent 并行)目前待验证,需要 controlled experiment。但从 decision continuity 的角度推导,单 agent 积累的上下文理解应该优于并行 agent 的事后聚合。
中文
1
0
0
40
Tianyi Cui
Tianyi Cui@tianyi·
我所在的 DeepSeek Harness 团队招人啦!目前开放的职位包括研发工程师和产品经理,可以在官网投递。如果想做 Harness 方向的前沿研究,也可以投递研究员职位。全职实习均可。地点限北京。 申请链接: app.mokahr.com/social-recruit… (附图是热心粉丝「白墙」帮做的 DeepSeek 同人图。)
Tianyi Cui tweet media
中文
176
113
1.1K
247.1K
Lesprivilege
Lesprivilege@lesprivilege·
@HappyGameClub @tianyi 主要的准备肯定会放在投递材料和 repo 和面试展开,但这么多人,初筛又太黑盒了,只能说也没有什么别的办法,做一些克制的动作,虽然噪声还是很高。
中文
1
0
0
25