lester violeta
312 posts

lester violeta
@lesterphv
teaching computers to speak || research scientist @dubguild || phd @nagoyauniv




テックブログを公開しました。 「Scaling Speech AI」の下、1Bから3Bへと音声言語モデルをスケールさせた際のTTS性能へ影響を検証しました。 日本語特有の読みや表記揺れ、表現の広がりがみられるに加え、現状の課題についても整理しています。 日本語音声生成・SpeechLM・TTSに関心のある方はぜひご覧ください。 blog.dubguild.com/melte/llm-tts-… 1B/3Bモデルの構築にあたって実施した、データ前処理・事前学習・事後学習の詳細も、今後順次公開していく予定です。 続報もお待ちいただければ幸いです。




本日、名古屋大学にて博士(情報学)の学位を取得しました! この5年間、支えてくださった皆さまに心より感謝します。卒業後はリサーチエンジニアとして働く予定なので、これからもニューラル音声モデルの研究開発に取り組んでいきたいと思います!!!!


🚀🎙️ New preprint: VoxServe — a streaming-first serving system for SpeechLMs. VoxServe delivers blazing-fast, high-throughput model inference for real-time Text-to-Speech / Speech-to-Speech applications. 🔗 arxiv.org/abs/2602.00269 💻 github.com/vox-serve/vox-…















