网易有道发布零口音免参考文本跨语种语音克隆模型:一个声音讲14种语言

2026/06/23 13:20阅读量 2

网易有道首发跨语种语音克隆模型,无需参考文本和口音模仿,仅用一个声音即可生成14种语言的语音克隆。该模型打破了传统语音克隆对参考音频和文本的依赖,降低了多语言内容生成门槛。

事件概述

网易有道正式发布其首个零口音、免参考文本的跨语种语音克隆模型。该模型的核心突破在于:用户无需提供目标语言的参考音频或文本,即可用同一个声音合成14种不同语言的语音,且在每种语言中均保持该声音的原始音色,不产生口音偏差。

核心信息

  • 模型特点:零口音(不产生外语口音)、免参考文本(无需提供目标语言文本或音频)、跨语种(14种语言)。
  • 应用场景:可用于多语言配音、有声内容制作、语音助手、教育翻译等领域,大幅降低多语言内容生产的成本和复杂度。
  • 技术意义:传统语音克隆需要目标语言的参考音频或至少一段文本对齐,该模型实现了更通用的语音克隆能力,使同一说话人能流畅切换多种语言。

值得关注

该模型的发布标志着语音克隆技术向“一次录制,全球通用”迈进,有望推动跨语言内容创作和国际化应用的普及。具体技术细节和开源情况有待官方进一步披露。

准备好启动您的定制项目了吗?

现在咨询,即可获得免费的业务梳理与技术架构建议方案。