kuto

3K posts

kuto banner
kuto

kuto

@kuto_bopro

Kaggle Master(🥇3)/強化学習に興味があります @LayerXcom

日本 福岡 Katılım Eylül 2018
893 Takip Edilen1.7K Takipçiler
Sabitlenmiş Tweet
kuto
kuto@kuto_bopro·
個人的に今1番熱いAgentic RLのサーベイ論文を読んだので理解を深めるために記事にしました! zenn.dev/kuto5046/artic…
日本語
0
46
337
26.6K
kuto
kuto@kuto_bopro·
Composer2.0はRLメインだったけど、2.5ではエージェントの局所的な行動に対してテキストフィードバックを与えて、それをもとにオンポリシーで(コンテキスト)蒸留して得たKL損失項を報酬に追加してRLしている。最近はRLとオンポリシー蒸留を組み合わせる手法をよく見る cursor.com/ja/blog/compos…
日本語
0
3
8
996
kuto
kuto@kuto_bopro·
論文読みアプリを作っているんだけど初期段階でClaude Designでワイヤーフレームワーク作りながら壁打ちするの良いな
kuto tweet mediakuto tweet mediakuto tweet media
日本語
0
9
257
91.3K
kuto
kuto@kuto_bopro·
@olachinkei 公開ありがとうございます!🙌
日本語
0
0
1
29
kuto
kuto@kuto_bopro·
ダウンロードしたので読む!!
Keisuke Kamata@olachinkei

Agentic RLのwhite paperを書きました 🗒️ W&B社内では @nejumi_dqx と章を分担し、 またなんとABEJAの @pppaaaooo よりAgentic RLの実装上のリアルなTipsを寄稿いただきました! Agentic RL は注目度が高まっている一方で、まだ体系的にまとまった資料が少ない領域だと思っています。 本資料では約60ページにわたり、 -GRPO / GSPO などのアルゴリズム解説 -Agentic RL の定義 -Agentic RL の実践 -Agentic RL を支える W&B の機能 などをまとめています。 誰でも無料でダウンロードできるようにしています。コミュニティへの貢献になっていれば嬉しいです! Agentic RLはAgentとモデル学習がどっちも味わえる面白い領域です! 誤りや改善点などあれば、ぜひフィードバックいただけるとありがたいです ダウンロードは thread から ↓

日本語
1
0
4
1K
kuto
kuto@kuto_bopro·
小規模モデルをRLしたものをサブエージェントとして利用し、フロンティアモデルは判断タスクに専念させるというアプローチが参考になる
Ramp Labs@RampLabs

x.com/i/article/2052…

日本語
1
0
10
1.3K
kuto retweetledi
pon / Hiromu Nakamura
pon / Hiromu Nakamura@po3rin·
今週のLayerX機械学習勉強会ではベクトル量子化において理論的下限に近い歪みと高い圧縮率を達成した TurboQuantについて解説しました。他にもQwen-Scope、Speculative Actions、Meta-Harnessなどの手法が紹介されました。 #LayerX機械学習勉強会 pages.layerx.co.jp/351cdd370bae80…
日本語
0
6
36
4.3K
kuto
kuto@kuto_bopro·
@civitaspo おめでとうございます!!
日本語
0
0
1
112
kuto
kuto@kuto_bopro·
今回GPT image2で論文をスライド化させるのを試したけどかなりいい感じだった! 図解力が高すぎる
日本語
0
0
9
753
kuto
kuto@kuto_bopro·
今週のLayerX機械学習勉強会ではDeepSeek-V4を紹介しました!ロングコンテキストにおけるアテンション計算の工夫が面白かったです! その他Vision Banana、ClawBench、LEARNING IS FORGETTING、Q-RAG、CORPUS2SkILL、GPT5.5、AITLが紹介されました。 #LayerX機械学習勉強会 pages.layerx.co.jp/34ecdd370bae80…
日本語
0
4
12
1.2K
kuto retweetledi
【公式】バクラク by LayerX
【公式】バクラク by LayerX@bakuraku_layerx·
LayerX主催「バックオフィスAIサミット」開催🚀✨ 経営、経理、人材・組織、現場のAI活用まで。 AIエージェントが仕事を終わらせる時代のバックオフィス再設計✍️📊 📅2026年6月19日 (金) 14:00〜 📌大手町三井ホール ▼セッション詳細・申込▼ bakuraku.jp/seminar/backof… #バックオフィスAIサミット
【公式】バクラク by LayerX tweet media
日本語
0
56
104
84.8K
kuto
kuto@kuto_bopro·
@takapy0210 うぉぉーー!おめでとうございます!!
日本語
1
0
1
179
kuto retweetledi
Yuya Matsumura
Yuya Matsumura@yu__ya4·
今週のLayerX機械学習勉強会では、AIエージェントメモリを異なるドメインで転移学習するMemory Transfer Learningについて解説しました。その他にもAttention to MambaやLLM-as-a-Verifier、SkillClaw、InfoMosai-Benchが紹介されました。 #LayerX機械学習勉強会 pages.layerx.co.jp/347cdd370bae80…
日本語
1
9
31
2.3K
kuto retweetledi
ゆめねこ
ゆめねこ@yume_neko92·
Orbit Warsを強化学習できてテンションが上がったので久々にNotebook公開しました。 色々と改良の余地ありですが、Getting StartedのSniperエージェントに完勝できるくらいには学習できてるので興味があったらぜひ。 kaggle.com/code/kashiwaba…
日本語
0
13
138
6.9K
kuto retweetledi
sbrf
sbrf@sbrf248·
今週のLayerX機械学習勉強会では、スキルを内在化するための学習手法 SKILL0 の論文を紹介しました。 その他、プロンプト最適化手法GEPA、長文コンテキスト処理のSRLM、 Uberの仕様書生成事例、CursorのComposer2 Technical Reportが紹介されました。 #LayerX機械学習勉強会 pages.layerx.co.jp/33acdd370bae80…
日本語
0
4
8
1.1K
kuto retweetledi
pon / Hiromu Nakamura
pon / Hiromu Nakamura@po3rin·
技術書典20!!LayerXの有志メンバーで新刊出します!!すごい本になった。このイカれた目次を見てよ!!僕は5章を担当してます! 下記リンクからサークルフォロー&新刊のお気に入り登録お願いします!! techbookfest.org/product/jbe1zd… #技術書典
pon / Hiromu Nakamura tweet mediapon / Hiromu Nakamura tweet media
日本語
0
22
110
11K
kuto retweetledi
しゅんけー「📕Pythonで学ぶ画像生成」発売中!
みなさん AI エージェント構築お疲れ様です 🤖 そんなみなさんに送る、 LLM を自律的に動かす #AgenticRL の最新動向を網羅した資料を公開しました! プランニング、ツール利用から、GUI、コード生成、数学エージェントまで、幅広い応用領域と未解決課題を解説しています 🔗 資料はリプライへ!
しゅんけー「📕Pythonで学ぶ画像生成」発売中! tweet mediaしゅんけー「📕Pythonで学ぶ画像生成」発売中! tweet mediaしゅんけー「📕Pythonで学ぶ画像生成」発売中! tweet mediaしゅんけー「📕Pythonで学ぶ画像生成」発売中! tweet media
日本語
2
39
262
19.8K