小米开源 OmniVoice:支持600+语种的语音克隆TTS模型
2026/04/09 10:20阅读量 2
小米正式开源OmniVoice,这是一款覆盖全球600多种语言的语音克隆文本转语音(TTS)模型。该模型旨在解决多语言场景下的语音合成难题,为开发者提供跨语言语音生成能力。项目代码已公开,标志着小米在AI语音领域的技术进一步开放。
事件概述
小米公司近日开源了名为 OmniVoice 的语音克隆 TTS(Text-to-Speech)模型。该项目是小米在人工智能语音领域的重要布局,旨在为全球开发者提供强大的多语言语音合成解决方案。
核心信息
- 模型名称:OmniVoice
- 主要功能:语音克隆与文本转语音(TTS)
- 语言覆盖:支持全球 600+ 种语言,涵盖主流语种及大量小语种。
- 发布状态:代码已开源,面向开发者社区开放。
值得关注
OmniVoice 的开源填补了多语言语音克隆技术在开源社区的空白。其能够处理如此庞大的语言种类,意味着该模型具备极强的泛化能力和跨语言迁移能力,适用于国际化应用、无障碍辅助工具及多语言内容创作等场景。
