Sabitlenmiş Tweet

個人的に今1番熱いAgentic RLのサーベイ論文を読んだので理解を深めるために記事にしました!
zenn.dev/kuto5046/artic…
日本語
kuto
3K posts

@kuto_bopro
Kaggle Master(🥇3)/強化学習に興味があります @LayerXcom



書きました!!一年越しの入社エントリです!!

Agentic RLのwhite paperを書きました 🗒️ W&B社内では @nejumi_dqx と章を分担し、 またなんとABEJAの @pppaaaooo よりAgentic RLの実装上のリアルなTipsを寄稿いただきました! Agentic RL は注目度が高まっている一方で、まだ体系的にまとまった資料が少ない領域だと思っています。 本資料では約60ページにわたり、 -GRPO / GSPO などのアルゴリズム解説 -Agentic RL の定義 -Agentic RL の実践 -Agentic RL を支える W&B の機能 などをまとめています。 誰でも無料でダウンロードできるようにしています。コミュニティへの貢献になっていれば嬉しいです! Agentic RLはAgentとモデル学習がどっちも味わえる面白い領域です! 誤りや改善点などあれば、ぜひフィードバックいただけるとありがたいです ダウンロードは thread から ↓

















