小米开源 OmniVoice:支持600+语种的语音克隆TTS模型

2026/04/09 10:20阅读量 2

小米正式开源OmniVoice,这是一款覆盖全球600多种语言的语音克隆文本转语音(TTS)模型。该模型旨在解决多语言场景下的语音合成难题,为开发者提供跨语言语音生成能力。项目代码已公开,标志着小米在AI语音领域的技术进一步开放。

事件概述

小米公司近日开源了名为 OmniVoice 的语音克隆 TTS(Text-to-Speech)模型。该项目是小米在人工智能语音领域的重要布局,旨在为全球开发者提供强大的多语言语音合成解决方案。

核心信息

  • 模型名称:OmniVoice
  • 主要功能:语音克隆与文本转语音(TTS)
  • 语言覆盖:支持全球 600+ 种语言,涵盖主流语种及大量小语种。
  • 发布状态:代码已开源,面向开发者社区开放。

值得关注

OmniVoice 的开源填补了多语言语音克隆技术在开源社区的空白。其能够处理如此庞大的语言种类,意味着该模型具备极强的泛化能力和跨语言迁移能力,适用于国际化应用、无障碍辅助工具及多语言内容创作等场景。

准备好启动您的定制项目了吗?

现在咨询,即可获得免费的业务梳理与技术架构建议方案。