
【論文要約】 「良かれと思って書いたドキュメントがAIを狂わせる」最新論文が示すAIエージェントの意外なボトルネック
リポジトリの作成者は「よかれ」と思ってAGENTS.mdやCLAUDE.mdをリポジトリに含めているが、これらのファイルは本当に役に立っているのだろうか? 改めて調査してみると「実は無い方がよいことがわかった」という結論で、なかなかびっくりである。
著者らはあまり知られていないリポジトリを収集して、イシューからバグを修正するタスクを行うベンチマークを新たに構築した。そしてLLMが自動生成したコンテキストファイルを含めたもの、人間が作成したコンテキストファイルを含めたもの、コンテキストファイルを含めないもの、3つのパターンでバグ修正のタスクを実行した。コーディングエージェントはClaudeCode+Sonnet-4.5など4つを利用して測定を行った。
結果として、LLMが自動生成したコンテキストファイルを含めたものは、コンテキストファイルを含まないものと比べて、タスクを完了する性能がわずかに低下する上に、トークンの消費量が20%も増えた。一方で、人間が作成したコンテキストファイルの場合はタスクを完了する性能がわずかに向上した。
この原因として、コンテキストファイルに含まれるリポジトリの概要が明らかに悪さをしていると著者らは指摘している。コーディングエージェントは目の前のバグを修正するための情報だけが必要なのに、コンテキストファイルにリポジトリの全体構成が書いてあるとそれに従って「これも調べなきゃ!」と広い範囲をみてしまい、結果としてノイズとなる。コンテキストファイルの情報は冗長で、コーディングエージェントはリポジトリ本体から情報を探せるので必要ないのである。
一方で、リポジトリに含まれていない情報を人間が書いて与えるのは有効であった。ただし簡潔なものに限り、網羅的なものは逆にタスクの完了率を低下させた。
異なるコーディングエージェントでコンテキストファイルを参照するとさらに性能が悪化する。これはLLMごとのプロンプトの記述スタイルの差が影響するからである。しかし同じコーディングエージェントから提供されたコンテキストファイルでも性能がわずかに悪化するのも重要な点である。
著者らの結論として、コンテキストファイルに含めないほうがいいもの、含めた方がいいものは以下となる。
含めないほうがいいもの:
・リポジトリの全体構成。LLMが自動で探索した方が賢く動けるため
・一般的なコーディングの心構え。広範で曖昧な指示はプロンプトを無駄に長くするだけ
含めた方がいいもの(最小限にするとよい):
・コードベースを見ただけでは判別できない暗黙の制約、ツールの制限など(使用してほしいツールのバージョンなど)
つまり「AIの行動を縛りすぎないように、絶対に破ってほしくないルールだけを箇条書きで最小限書く」のが2026年での正解である。
一般的に言われていることの逆の結論で大変面白いだけでなく、今すぐ使えるテクニックだと思った。AGENTS.mdが有効かどうかは検証が行われていなかったのは盲点だった。悪影響が出る点を読むと、今のLLMなら確かにそうなると容易に理解できる。盲目的に従うのではなく、批判的な視点を持つのは大事だなと改めて思った。
arxiv.org/abs/2602.11988
日本語