
Ryuichiro Higashinaka
83 posts


NII/LLMCの対話WGより,音声URL集「CC Audio」「Archive.org Audio Dataset」を公開しました.日本語だけで48,000時間超のデータにアクセス可能です.大規模音声モデルの構築や多様な音響のモデリングにご活用ください.
nii.ac.jp/news/release/2…
日本語
Ryuichiro Higashinaka retweetledi

✏️ニュースリリース
約12兆トークンの良質なコーパスで学習した新たな国産LLM「LLM-jp-4 8Bモデル」「LLM-jp-4 32B-A3Bモデル」をオープンソースライセンスで公開
~一部ベンチマークでGPT-4oやQwen3-8Bを上回る性能を達成~
nii.ac.jp/news/release/2…
大学共同利用機関法人 情報・システム研究機構 国立情報学研究所大規模言語モデル研究開発センター(LLMC)は、同センターが主宰するLLM研究開発コミュニティ「LLM-jp」の活動の中で大規模言語モデル(LLM)のフルスクラッチ学習を実施し、約86億パラメータの「LLM-jp-4 8Bモデル」と約320億パラメータのMoEモデル「LLM-jp-4 32B-A3Bモデル」をオープンソースライセンスで一般公開しました。公開モデルの学習では、オープンソースAIの定義(OSAID)に配慮し、第三者も入手可能な良質な学習コーパスの収集・選別・構築を行い、インターネット上の公開データや政府・国会の文書、合成データなどからなる約12兆トークンの学習コーパスを整備・使用しました。公開モデルは最大で約6万5千トークンの入出力まで処理でき、言語モデルの日本語理解能力を測る「日本語 MT-Bench」、英語理解能力を測る「MT-Bench」において、強力な多言語LLMである「GPT-4o」や「Qwen3-8B」を上回る性能を達成しています。
LLMCでは「LLM-jp-4 8Bモデル」とMoEモデル「LLM-jp-4 32B-A3Bモデル」を活用してLLMの透明性・信頼性の確保に向けた研究開発を進めていきます。また、現在、より大規模なパラメータを備えたモデルの開発を進めており、2026年度に順次公開予定です。
日本語

LLM-jpの研究紹介動画でモデレータを担当しました.LLM開発の現状や最先端の取り組みだけでなく,研究者たちの想いやこだわりまでたっぷり語っていただいています.👀 LLM開発に関心のある方はぜひご覧ください.
youtube.com/watch?v=MceDQP…

YouTube
日本語

@kumazo_2 NVIDIAのPersonaPlexでは,対象タスクや人格に関する合成データを作成し,ベースのモデルをファインチューニングすることで,そのようなことを実現しています.同様のアプローチが有効かと思います.
日本語

NII/LLMCの対話WGの成果として,日本語リアルタイム音声対話モデル LLM-jp-Moshi-v1 を公開しました!LLM-jpで独自に収集したデータを用いて学習しており,商用利用可能なライセンスです.詳しくは下記のリリースをご覧ください.
nii.ac.jp/news/release/2…
日本語

@kwashizzz J-CHATで学習したモデルのApache 2.0公開は問題ないと考えています.情報解析(著作権法30条の4)においてはCC BY-NCの制限を受けず,またデータとモデルは法的に別物でありライセンスは継承されません.さらに,事前学習の性質上,元音声がそのまま再現される可能性も極めて低いと考えております.
日本語

4月に登壇した日本科学未来館でのイベントレポートが公開されました.J-Moshi搭載アンドロイドとの対話シーンもありますので,ぜひご覧ください🤖
blog.miraikan.jst.go.jp/articles/20251…
日本語

複数人対話コーパスを公開しました🗣️ 人間とAIはどちらが関係性を正確に読み取れるのか?そんな疑問に答える研究をSEMDIAL2025で発表しました.ぜひご活用ください.
dililab.uni-bielefeld.de/semdial2025/se…
やましー@yamasy1549
🆕Multi-Relational Multi-Party Chat Corpusコーパス(MRMP)を公開しました🎉 初対面や家族話者の雑談を含む、日本語の複数人対話コーパスです。 商用利用可で、今後発展が期待される複数人対話システムの開発などにお使いいただけます。 github.com/nu-dialogue/mu…
日本語

Our lab's research is featured in this article. In addition to J-Moshi, it covers our robot experiments and other work. Please take a look if you're interested!
Nagoya University@NagoyaUniv
[Research] 🤖🇯🇵Researchers at @nagoya_univ have created #JMoshi, the first publicly available #AI designed for natural Japanese conversation patterns. It captures natural dialogue with "aizuchi" interjections while speaking and listening simultaneously. bit.ly/44ITdkz
English

4/20(日)に日本科学未来館にて雑談AIに関するイベントが行われます.ゲストとして出演しますので,よろしければお越しください.
miraikan.jst.go.jp/events/2025042…
日本語
Ryuichiro Higashinaka retweetledi

📢 Just released an unofficial codebase for finetuning Moshi by @kyutai_labs ! This repo provides scripts from data prep to training and inference on your own data. We used it to build J-Moshi 🇯🇵, the Japanese version of Moshi.
github.com/nu-dialogue/mo…
English

J-Moshiについて中日新聞さんに取材いただきました😀私が対話している動画も載っています.本日の朝刊📰でもご覧いただけます.
中日新聞@chunichi_denhen
【実演動画】 まるで人間? 名古屋大院の研究グループが開発したAI対話システム「J-Moshi」 ▼動画や記事はこちら chunichi.co.jp/article/1041080
日本語

対話システムライブコンペティションについてより詳しく知りたい方は,HPをご確認ください.
sites.google.com/view/dslc7
日本語
Ryuichiro Higashinaka retweetledi

【まるで生きた人間】相手の話を聞きながら話せる通話型AI「J-Moshi」を開発!
nazology.kusuguru.co.jp/archives/170123
名大は、まるで友人同士のような自然な会話ができる通話型AIの開発に成功したと発表。このAIは相手の話に相槌を打ちながら会話ができます。その驚きの会話の様子をお聴き下さい。

日本語








