のぶ

325 posts

のぶ

のぶ

@nobug5c9

京大黒橋研 → NEC データサイエンスラボラトリ / 日本語 DeBERTa 学習 / KWJA & rhoknp 開発

川崎市 Katılım Şubat 2019
265 Takip Edilen403 Takipçiler
のぶ retweetledi
国立情報学研究所(NII)
✏️ニュースリリース 約12兆トークンの良質なコーパスで学習した新たな国産LLM「LLM-jp-4 8Bモデル」「LLM-jp-4 32B-A3Bモデル」をオープンソースライセンスで公開 ~一部ベンチマークでGPT-4oやQwen3-8Bを上回る性能を達成~ nii.ac.jp/news/release/2…  大学共同利用機関法人 情報・システム研究機構 国立情報学研究所大規模言語モデル研究開発センター(LLMC)は、同センターが主宰するLLM研究開発コミュニティ「LLM-jp」の活動の中で大規模言語モデル(LLM)のフルスクラッチ学習を実施し、約86億パラメータの「LLM-jp-4 8Bモデル」と約320億パラメータのMoEモデル「LLM-jp-4 32B-A3Bモデル」をオープンソースライセンスで一般公開しました。公開モデルの学習では、オープンソースAIの定義(OSAID)に配慮し、第三者も入手可能な良質な学習コーパスの収集・選別・構築を行い、インターネット上の公開データや政府・国会の文書、合成データなどからなる約12兆トークンの学習コーパスを整備・使用しました。公開モデルは最大で約6万5千トークンの入出力まで処理でき、言語モデルの日本語理解能力を測る「日本語 MT-Bench」、英語理解能力を測る「MT-Bench」において、強力な多言語LLMである「GPT-4o」や「Qwen3-8B」を上回る性能を達成しています。  LLMCでは「LLM-jp-4 8Bモデル」とMoEモデル「LLM-jp-4 32B-A3Bモデル」を活用してLLMの透明性・信頼性の確保に向けた研究開発を進めていきます。また、現在、より大規模なパラメータを備えたモデルの開発を進めており、2026年度に順次公開予定です。
日本語
12
608
2K
360.2K
のぶ
のぶ@nobug5c9·
ホテルにもう一泊させてもらえることになって一安心😌 経験値++
日本語
0
0
6
234
のぶ
のぶ@nobug5c9·
帰りのフライトが急にキャンセルされた…… これは初めての空港寝泊まりコースか??
日本語
0
0
3
372
のぶ
のぶ@nobug5c9·
モロッコの味噌ラーメン、ちゃんと箸が付いていた 現地の人も使うのかと店員に聞いてみると、「あれを使えたのはお前だけだ」と言われてちょっと主人公気分を味わえた
のぶ tweet media
日本語
0
0
8
246
のぶ retweetledi
Ryuichiro Higashinaka
Ryuichiro Higashinaka@RHigashinaka·
LLM-jpの研究紹介動画でモデレータを担当しました.LLM開発の現状や最先端の取り組みだけでなく,研究者たちの想いやこだわりまでたっぷり語っていただいています.👀 LLM開発に関心のある方はぜひご覧ください. youtube.com/watch?v=MceDQP…
YouTube video
YouTube
日本語
0
10
28
4.9K
のぶ
のぶ@nobug5c9·
アクセント符号多くて難しい文字だなーと思ったら鳥だった
のぶ tweet media
日本語
0
0
6
294
のぶ
のぶ@nobug5c9·
モロッコ着いたー 治安は悪くなさそうだけど、大阪並みに誰も信号守ってないな
日本語
0
0
3
155
のぶ
のぶ@nobug5c9·
設営完了!
のぶ tweet media
日本語
0
2
20
1.2K
のぶ
のぶ@nobug5c9·
#NLP2026 で3月10日16:55 から以下の発表があります〜 VLM が扱いやすいように文書をいい感じの粒度で分けてあげる話です ぜひお話ししましょう〜! anlp.jp/proceedings/an…
のぶ tweet media
日本語
0
9
57
3.3K
のぶ
のぶ@nobug5c9·
コツコツ作っていたWikipediaコーパスが完成しました! 日本語約9,000文に、読みを含む形態素、係り受け、述語項構造などが付いています🙌(CC BY-SA 4.0) github.com/ku-nlp/Wikiped…
のぶ tweet media
日本語
0
63
251
16.6K
のぶ
のぶ@nobug5c9·
NLP2026も投稿した! 宇都宮から1週間空けてモロッコだ🇲🇦
日本語
0
0
5
528
のぶ retweetledi
mooz
mooz@stillpedant·
Webブラウザを人間よりも高い精度で操作することに(世界で初めて)成功しました! 今回、開発した cotomi Act というエージェント技術はWebArena というWebエージェントのベンチマークで8/27現在、人間も上回って世界トップ性能の実現に成功しています。 jpn.nec.com/press/202508/2… 🧵
mooz tweet mediamooz tweet media
日本語
2
110
764
122.4K
のぶ retweetledi
mooz
mooz@stillpedant·
チームの仕事が NAACL’25, COLM’25, EMNLP’25 と連続して採択されたので、解説・宣伝してみます(例によってめちゃくちゃ長い)。 我々は cotomi というLLMを楽しくも苦しみながら作っているのですが、特に大変なのは事後学習。 これはベースモデルに対して 「どんなデータをどんな手順で入れるか」 「どんなモデルをマージするか」 みたいな施策を人間が考え、実施し、品質をチェックし、一喜一憂を繰り返すフェーズで、はっきりいえば 労働集約の塊 な営みです。LLMのリリース前は深夜まで無数のモデルの結果を眺めて「うーん」というのを繰り返す、なかなかストレスフルな日々が続きます。 そんな労働集約な「LLM開発自体」を 「LLMやML技法の活用で改善できないか?」 というのが今回の3つの研究に共通するモチベーション。ドッグフーディング的な研究ですね。
mooz tweet mediamooz tweet mediamooz tweet media
日本語
1
19
130
25K
のぶ
のぶ@nobug5c9·
2日連続2時間バドとかいう高校生みたいなムーブをしてしまった
日本語
0
0
6
498
のぶ
のぶ@nobug5c9·
空港ダッシュして乗り継ぎ30分チャレンジ成功
日本語
0
0
4
472
のぶ
のぶ@nobug5c9·
州会議事堂からの景色とても良い
のぶ tweet media
日本語
0
0
3
204
のぶ
のぶ@nobug5c9·
同行者が体調不良で「今夜」のカントリーミュージックライブのチケットが1枚余ってます!興味ある方ご連絡ください🙏 #CVPR2025
日本語
1
0
1
441