Hayato Futami

798 posts

Hayato Futami

Hayato Futami

@emonosuke

Research engineer at Sony, Speech and language AI. Views are my own.

Tokyo / Kyoto Joined Ocak 2022
610 Following405 Followers
Hayato Futami
Hayato Futami@emonosuke·
i was surprised my submission number was over 10k
English
0
0
5
304
Hayato Futami
Hayato Futami@emonosuke·
@Muramasa_2 おめでとうございます!!🙌 共にがんばりましょう!!
日本語
1
0
0
72
Muramasa
Muramasa@Muramasa_2·
私事ですが本日入籍しました💍 気を引き締め直して仕事も研究も引き続きがんばりますので、今後ともよろしくお願いします!
日本語
25
0
182
6.6K
Hayato Futami
Hayato Futami@emonosuke·
Kyutai の発表は Sakana の発表に意図的に被せているのかな、気になる
日本語
0
0
6
623
Hayato Futami retweeted
🐿️🐒🗻📚🐹🦈
音AIモデル開発にWebデータガンガン使おうぜ派 VS 音AIモデル開発にWebデータ絶対使うな派 VS ダークライ
日本語
0
2
19
2.2K
Hayato Futami retweeted
Hayato Futami retweeted
🐿️🐒🗻📚🐹🦈
All speech reseach will be done by GDM. Pokémon Pokopia is all I can do
Deutsch
1
2
7
1.3K
Hayato Futami retweeted
Alexandr Wang
Alexandr Wang@alexandr_wang·
1/ today we're releasing muse spark, the first model from MSL. nine months ago we rebuilt our ai stack from scratch. new infrastructure, new architecture, new data pipelines. muse spark is the result of that work, and now it powers meta ai. 🧵
Alexandr Wang tweet media
English
729
1.2K
10.4K
4.5M
Hayato Futami
Hayato Futami@emonosuke·
神話の時代
日本語
0
0
0
134
Hayato Futami retweeted
Shinji Watanabe
Shinji Watanabe@shinjiw_at_cmu·
6 papers (4 main and 2 findings) were accepted at #ACL2026! All are speech papers :)
Shinji Watanabe tweet media
English
1
10
97
4.8K
Hayato Futami retweeted
Taka@ElevenLabs
Taka@ElevenLabs@tkhr410·
最近イベントなどや打ち合わせの場で「ElevenLabsってSTSないの?」と言われる機会も多くなりました。 本noteブログはの質問に対するElevenLabsとしての回答となります。 気になる方はご笑覧ください。 note.com/taka_410/n/nfc…
日本語
0
1
17
6.6K
Hayato Futami retweeted
あゆ
あゆ@aya172957·
NLP2026のワークショップで表彰して頂いたLLM-JP-4をベースにした日本語SpeechLLMを公開しました!chatモデルと音声認識モデルを商用利用可能なライセンスで公開しています!!
あゆ@aya172957

NLP2026の第2回「大規模言語モデルのファインチューニング技術と評価」ワークショップにて我々の『合成データを使用した日本語音声LLMの開発』が自由形タスク1位で表彰をいただきました!大規模な計算資源の提供など運営の方々ありがとうございました!

日本語
2
43
203
42.3K
Hayato Futami retweeted
mamita
mamita@chemical_tree·
最近仕事で音声周りの研究開発もやるようになった関係で初めて某speechの査読を引き受けてみたが(たまたま運がよかったのか)面白い&勉強になる当たり論文が多くて休日返上で査読してもぎりポジティブな気持ちになれてるの久しぶりかも
日本語
0
2
13
1.4K
Hayato Futami retweeted
Microsoft AI
Microsoft AI@MicrosoftAI·
The most accurate model across 25 languages, faster transcription speeds, and stronger performance in real‑world noise. MAI‑Transcribe‑1 sets a new bar for speech recognition. Learn more + try it today: msft.it/6019QLa8B
Microsoft AI tweet mediaMicrosoft AI tweet media
English
7
39
306
25.2K
Hayato Futami retweeted
ぬこぬこ / NUKO 🇯🇵
Gemma 4 Google DeepMind のマルチモーダルモデル。Apache 2.0。パラメータ数あたりの知能がかつてないほどに高い。Effective 2B、4B、26B MoE、31B の 4 種類。画像、動画、音声入力に対応。Context Window は 128k~256k。140 言語以上に対応。Hugging Face などで。 blog.google/innovation-and…
日本語
1
17
79
40.5K
Hayato Futami retweeted
Eustache Le Bihan
Eustache Le Bihan@eustachelb·
HF audio team member here 👋🤗 Don’t want to be the party pooper here, but those look a little… questionable 🙊 Would love to be proven wrong though, @WillowVoiceAI what about adding the model to the leaderboard? BTW We’re working on private test sets for the Open ASR Leaderboard to address this tipe of questions, but here, the model is the closest you can get (understandable ofc since your product is built on it)
Willow@WillowVoiceAI

Most models score 5-7% word error rate on clean audio. In real-world conditions they fall to 10-15%. Atlas 1 holds at 1.2% on clean audio and 2.1% in production. The gap widens in noisy environments.

English
5
2
107
15.4K