Sho Takase

248 posts

Sho Takase

Sho Takase

@shot4410

自然言語処理の研究をしています

Katılım Eylül 2020
147 Takip Edilen1.2K Takipçiler
Sho Takase retweetledi
Kazuki Fujii
Kazuki Fujii@okoge_kaz·
Finally!! Accepted to ICLR 2026! 🎉 Cited by Nemotron 3 Nano and OLMo 3, yet it was a long journey to get this through academic peer review. So glad to cross the finish line. 📄 Rewriting Pre-Training Data Boosts LLM Performance in Math and Code: arxiv.org/abs/2505.02881
Kazuki Fujii tweet media
Kazuki Fujii@okoge_kaz

We are thrilled to see our dataset improvement method (SwallowCode) mentioned in the Pre-Training Code Dataset section of the NVIDIA Nemotron 3 Nano Technical Report. Thank you @NVIDIAAI for citing the Swallow Project's work! The Swallow Project is a research initiative developing open bilingual LLMs excelling in both Japanese and English. swallow-llm.github.io/index.en.html

English
6
36
284
39.6K
Sho Takase retweetledi
Tsubasa Takahashi
Tsubasa Takahashi@tsubasashi·
My first author paper (work done at Turing Inc.) has been accepted to ICLR 2026! #ICLR2026 Thanks for all co-authors and ex-colleagues!!
English
3
12
127
19.2K
Sho Takase
Sho Takase@shot4410·
@okoge_kaz なるほど、年次大会の直後にGTCというスケジュールなんですね、それは確かに大変ですね。頑張ってください。 はい、こちらこそ是非お願いします。自分は基本的に空いているので。
日本語
0
0
1
114
Kazuki Fujii
Kazuki Fujii@okoge_kaz·
@shot4410 ありがとうございます! >参加予定はない そうですか...残念です。 NVIDIA GTCの発表準備などの関係で、言語処理学会には参加しない予定でした。 高瀬さんのご予定が合えば、2月中旬-下旬あたりでお昼ご一緒させていただけますと嬉しいです。
日本語
1
0
0
229
Sho Takase
Sho Takase@shot4410·
共著の論文がICLRに採択されました。 大規模言語モデルの事前学習において学習率を下げずに終わらせた方がチューニング後の性能まで含めると性能が良いということを示しています。査読者の3/4がReject寄りの点数でしたが逆転できました。
Kazuki Yano@kyano__nlp

My first-author paper has been accepted to #ICLR2026! Huge thanks to my co-authors: @shunkiyono, @sosk_sosk, @shot4410, and @drJunSuzuki!

日本語
1
9
79
11.1K
Sho Takase
Sho Takase@shot4410·
@okoge_kaz ありがとうございます! 藤井さんもおめでとうございます ICLRは自分は今のところは参加予定はないですね。予算の面で気軽に行けそうな場所ではないので……。 言語処理学会年次大会には参加するのでもしそちらに参加されるのであればそこでお話できればと思います。
日本語
1
0
1
431
Kazuki Fujii
Kazuki Fujii@okoge_kaz·
@shot4410 おめでとうございます! 高瀬さんはICLR現地参加されますか?(自分は参加予定なので、現地でお話しできればと思いまして)
日本語
1
0
1
804
Sho Takase retweetledi
Kosuke Yamada
Kosuke Yamada@kosyamada·
サイバーエージェントAI lab アドベントカレンダー16日目の記事を公開しました!タイトルの通り、Geminiに謎解きをさせてみましたという話です。簡単な検証しかしてないですが、面白い結果になっているかと。どうしたら解けるようになりそうか分かったら教えて欲しいです。 zenn.dev/kosyamada/arti…
日本語
1
7
20
2.8K
Sho Takase retweetledi
CyberAgent AI事業本部広報
CyberAgent AI事業本部広報@cyberagent_ai·
\ アドベントカレンダー更新中 / 研究開発組織AI Labにおいて、有志メンバーによる「CyberAgent AI Lab Advent Calendar 2025」を毎日更新しています✨ 皆さまぜひご覧ください! adventar.org/calendars/11573
日本語
0
10
24
4.3K
Sho Takase
Sho Takase@shot4410·
CyberAgent AI Labアドベントカレンダーとして記事を書きました。 Transformerの発展を概説していて、元々の論文で提案されている構造と、LLMで使用されている構造は全然違います、という話です。 zenn.dev/shot4410/artic…
日本語
0
68
284
26.9K
Sho Takase
Sho Takase@shot4410·
なお、この論文に関してCOLMでは「2020年以前の論文は古すぎるから議論の俎上に載せるな」「引用数が数件の論文は無価値」という、だいぶ強い主張をする査読者が出現し、なかなかエキサイティングでした openreview.net/forum?id=52YBE…
日本語
0
3
23
2.7K
Sho Takase
Sho Takase@shot4410·
COLM 2025で発表予定の論文の紹介スライドをアップしました。 大規模言語モデルの学習を制御するために Transformer の勾配のノルムの上界を算出し、これを抑える条件を提示しています。 speakerdeck.com/takase/snlp202…
日本語
1
8
57
11.9K
Sho Takase retweetledi
mooz
mooz@stillpedant·
Webブラウザを人間よりも高い精度で操作することに(世界で初めて)成功しました! 今回、開発した cotomi Act というエージェント技術はWebArena というWebエージェントのベンチマークで8/27現在、人間も上回って世界トップ性能の実現に成功しています。 jpn.nec.com/press/202508/2… 🧵
mooz tweet mediamooz tweet media
日本語
2
110
768
122.1K
Sho Takase
Sho Takase@shot4410·
7月末でSB Intuitionsを退職し、8月よりサイバーエージェント AI Labで働いています。 引き続き、大規模言語モデル周辺というか、自然言語処理・機械学習分野の研究に取り組む予定です。
日本語
2
29
287
47.5K
Sho Takase
Sho Takase@shot4410·
@FQCme1 こちらこそ良い本をありがとうございます。アカウントを発見できなくて元ポストに含められず申し訳ない…
日本語
0
0
1
94
FQC🤗
FQC🤗@FQCme1·
@shot4410 ありがとうございます🙇🙏🙏🙏
日本語
1
0
1
168
Sho Takase
Sho Takase@shot4410·
著者の福地成彦さんから『LLMとハルシネーション 基礎と対策』をご恵贈いただきました。自然言語処理の基礎を概観した後にLLMを紹介し、ハルシネーションやRAGにふれるという盛り沢山な内容。ところどころに挿入されているノートは読み物として面白く、より詳しく知るための文献案内があるのも親切。
Sho Takase tweet media
日本語
1
2
27
4.5K