kuto

3K posts

kuto

@kuto_bopro

Kaggle Master(🥇3)/強化学習に興味があります @LayerXcom

日本福岡 Katılım Eylül 2018

893 Takip Edilen1.7K Takipçiler

Sabitlenmiş Tweet

kuto@kuto_bopro·9 Eki

個人的に今1番熱いAgentic RLのサーベイ論文を読んだので理解を深めるために記事にしました！ zenn.dev/kuto5046/artic…

日本語

337

26.6K

kuto@kuto_bopro·2d

Composer2.0はRLメインだったけど、2.5ではエージェントの局所的な行動に対してテキストフィードバックを与えて、それをもとにオンポリシーで(コンテキスト)蒸留して得たKL損失項を報酬に追加してRLしている。最近はRLとオンポリシー蒸留を組み合わせる手法をよく見る cursor.com/ja/blog/compos…

日本語

996

kuto@kuto_bopro·4d

論文読みアプリを作っているんだけど初期段階でClaude Designでワイヤーフレームワーク作りながら壁打ちするの良いな

日本語

257

91.3K

kuto@kuto_bopro·14 May

ponさんインプット・アウトプット(もちろんアウトカムも)の量が凄まじくてめちゃ刺激もらっている！

pon / Hiromu Nakamura@po3rin

書きました！！一年越しの入社エントリです！！

日本語

782

kuto retweetledi

pon / Hiromu Nakamura@po3rin·14 May

書きました！！一年越しの入社エントリです！！

pon / Hiromu Nakamura@po3rin

x.com/i/article/2054…

日本語

26K

kuto@kuto_bopro·14 May

@olachinkei 公開ありがとうございます！🙌

日本語

Keisuke Kamata@olachinkei·14 May

@kuto_bopro 光栄です！是非！

日本語

kuto@kuto_bopro·14 May

ダウンロードしたので読む！！

Keisuke Kamata@olachinkei

Agentic RLのwhite paperを書きました 🗒️ W&B社内では @nejumi_dqx と章を分担し、またなんとABEJAの @pppaaaooo よりAgentic RLの実装上のリアルなTipsを寄稿いただきました！ Agentic RL は注目度が高まっている一方で、まだ体系的にまとまった資料が少ない領域だと思っています。本資料では約60ページにわたり、 -GRPO / GSPO などのアルゴリズム解説 -Agentic RL の定義 -Agentic RL の実践 -Agentic RL を支える W&B の機能などをまとめています。誰でも無料でダウンロードできるようにしています。コミュニティへの貢献になっていれば嬉しいです！ Agentic RLはAgentとモデル学習がどっちも味わえる面白い領域です！誤りや改善点などあれば、ぜひフィードバックいただけるとありがたいですダウンロードは thread から ↓

日本語

kuto@kuto_bopro·8 May

フレームワークはPrime RLを使っている github.com/PrimeIntellect…

日本語

239

kuto@kuto_bopro·8 May

小規模モデルをRLしたものをサブエージェントとして利用し、フロンティアモデルは判断タスクに専念させるというアプローチが参考になる

Ramp Labs@RampLabs

x.com/i/article/2052…

日本語

1.3K

kuto retweetledi

pon / Hiromu Nakamura@po3rin·7 May

今週のLayerX機械学習勉強会ではベクトル量子化において理論的下限に近い歪みと高い圧縮率を達成した TurboQuantについて解説しました。他にもQwen-Scope、Speculative Actions、Meta-Harnessなどの手法が紹介されました。 #LayerX機械学習勉強会 pages.layerx.co.jp/351cdd370bae80…

日本語

4.3K

kuto@kuto_bopro·1 May

@civitaspo おめでとうございます！！

日本語

112

ｷｳﾞｨﾀｽﾎﾟ(人工知能)@civitaspo·1 May

さっき3人目の子どもが産まれた！！！わっしょい！！！

日本語

176

5.2K

kuto@kuto_bopro·28 Nis

今回GPT image2で論文をスライド化させるのを試したけどかなりいい感じだった！図解力が高すぎる

日本語

753

kuto@kuto_bopro·28 Nis

今週のLayerX機械学習勉強会ではDeepSeek-V4を紹介しました！ロングコンテキストにおけるアテンション計算の工夫が面白かったです！その他Vision Banana、ClawBench、LEARNING IS FORGETTING、Q-RAG、CORPUS2SkILL、GPT5.5、AITLが紹介されました。 #LayerX機械学習勉強会 pages.layerx.co.jp/34ecdd370bae80…

日本語

1.2K

kuto retweetledi

【公式】バクラク by LayerX@bakuraku_layerx·28 Nis

LayerX主催「バックオフィスAIサミット」開催🚀✨ 経営、経理、人材・組織、現場のAI活用まで。 AIエージェントが仕事を終わらせる時代のバックオフィス再設計✍️📊 📅2026年6月19日 (金) 14:00〜 📌大手町三井ホール ▼セッション詳細・申込▼ bakuraku.jp/seminar/backof… #バックオフィスAIサミット

日本語

104

84.8K

kuto@kuto_bopro·23 Nis

@takapy0210 うぉぉーー！おめでとうございます！！

日本語

179

takapy | たかぱい@takapy0210·23 Nis

4月からCTOの役割を引き継ぎました！ AI Nativeやっていくぞ💪 コネヒト、CTO（最高技術責任者）に野澤哲照が就任 prtimes.jp/main/html/rd/p… via @PRTIMES_JP

日本語

125

8.8K

kuto retweetledi

Yuya Matsumura@yu__ya4·23 Nis

今週のLayerX機械学習勉強会では、AIエージェントメモリを異なるドメインで転移学習するMemory Transfer Learningについて解説しました。その他にもAttention to MambaやLLM-as-a-Verifier、SkillClaw、InfoMosai-Benchが紹介されました。 #LayerX機械学習勉強会 pages.layerx.co.jp/347cdd370bae80…

日本語

2.3K

kuto retweetledi

ゆめねこ@yume_neko92·22 Nis

Orbit Warsを強化学習できてテンションが上がったので久々にNotebook公開しました。色々と改良の余地ありですが、Getting StartedのSniperエージェントに完勝できるくらいには学習できてるので興味があったらぜひ。 kaggle.com/code/kashiwaba…

日本語

138

6.9K

kuto retweetledi

sbrf@sbrf248·8 Nis

今週のLayerX機械学習勉強会では、スキルを内在化するための学習手法 SKILL0 の論文を紹介しました。その他、プロンプト最適化手法GEPA、長文コンテキスト処理のSRLM、 Uberの仕様書生成事例、CursorのComposer2 Technical Reportが紹介されました。 #LayerX機械学習勉強会 pages.layerx.co.jp/33acdd370bae80…

日本語

1.1K

kuto retweetledi

pon / Hiromu Nakamura@po3rin·6 Nis

技術書典20！！LayerXの有志メンバーで新刊出します！！すごい本になった。このイカれた目次を見てよ！！僕は5章を担当してます！下記リンクからサークルフォロー&新刊のお気に入り登録お願いします！！ techbookfest.org/product/jbe1zd… #技術書典

日本語

110

11K

kuto retweetledi

しゅんけー「📕Pythonで学ぶ画像生成」発売中！@shunk031·3 Nis

みなさん AI エージェント構築お疲れ様です 🤖 そんなみなさんに送る、 LLM を自律的に動かす #AgenticRL の最新動向を網羅した資料を公開しました！プランニング、ツール利用から、GUI、コード生成、数学エージェントまで、幅広い応用領域と未解決課題を解説しています 🔗 資料はリプライへ！

日本語

262

19.8K

kuto retweetledi

Yuya Matsumura@yu__ya4·31 Mar

AI・LLMエンジニアの通年インターンとサマーインターンのJDも公開しています。ごりごりにAIエージェントを社会実装したい学生の皆様、とてもお待ちしております！ open.talentio.com/r/1/c/layerx/p… open.talentio.com/r/1/c/layerx/p…

日本語

32.8K

Keşfet

@olachinkei @civitaspo @takapy0210 @PRTIMES_JP @elonmusk @BarackObama @taylorswift13 @cristiano