OAO أُعيد تغريده

英伟达出了一个 0.6B 的语音识别模型,纯 CPU 就能跑,速度还快了2.5倍
Nemotron-3.5-ASR,只有 0.6B 参数,支持 40 多种语言的实时语音识别
不需要 GPU。你的笔记本 CPU 就能直接跑,而且比英伟达自己官方的 Nemo 运行时还快 2.5 倍,识别准确率一样
完全离线运行,数据不出本地
LocalAI 团队做了一个 C++ 实现叫 parakeet.cpp(跟 llama.cpp 一个思路),可以直接集成到本地的 AI Agent 工作流里
之前发过 LibreTranslate 做本地翻译,现在语音识别也可以本地跑了。再加上本地跑的小模型做推理,一整套 AI 工作流完全可以在离线环境下运行
对做语音相关应用的开发者来说,0.6B 的模型大小意味着部署成本极低。手机上都能跑
GitHub 搜 parakeet.cpp
中文






















