阶跃星辰发布StepAudio 2.5 TTS:强化语境控制与零样本复刻能力

2026/04/16 15:22阅读量 5

4月16日,阶跃星辰正式发布新一代语音生成模型StepAudio 2.5 TTS。该模型在自然语言合成控制、全局及文中语境理解、零样本音色复刻等方面实现升级,旨在服务于角色配音、有声内容创作及智能交互场景。目前,该模型已全量上线阶跃星辰开放平台及Step Plan计划。

事件概述

4月16日,阶跃星辰(StepFun)正式推出新一代语音生成模型 StepAudio 2.5 TTS。该模型主要面向角色配音、有声内容创作以及智能语音交互等应用场景,标志着其在文本转语音(TTS)领域的技术迭代。

核心功能升级

StepAudio 2.5 TTS 在以下关键能力上进行了显著优化:

  • 自然语言控制:支持利用自然语言指令直接进行语音合成的参数控制,提升了交互的灵活性与精准度。
  • 语境控制增强:强化了全局语境理解与文中语境控制能力,使生成的语音在情感表达和上下文连贯性上更加自然。
  • 音色复刻与全控:实现了零样本(Zero-shot)音色复刻与全音色控制,能够更快速地适配不同声音风格。

发布状态

目前,StepAudio 2.5 TTS 已全量上线 阶跃星辰开放平台 以及 Step Plan 计划,供开发者及企业用户调用。

准备好启动您的定制项目了吗?

现在咨询,即可获得免费的业务梳理与技术架构建议方案。