阶跃星辰发布StepAudio 2.5 TTS:强化语境控制与零样本复刻能力
2026/04/16 15:22阅读量 5
4月16日,阶跃星辰正式发布新一代语音生成模型StepAudio 2.5 TTS。该模型在自然语言合成控制、全局及文中语境理解、零样本音色复刻等方面实现升级,旨在服务于角色配音、有声内容创作及智能交互场景。目前,该模型已全量上线阶跃星辰开放平台及Step Plan计划。
事件概述
4月16日,阶跃星辰(StepFun)正式推出新一代语音生成模型 StepAudio 2.5 TTS。该模型主要面向角色配音、有声内容创作以及智能语音交互等应用场景,标志着其在文本转语音(TTS)领域的技术迭代。
核心功能升级
StepAudio 2.5 TTS 在以下关键能力上进行了显著优化:
- 自然语言控制:支持利用自然语言指令直接进行语音合成的参数控制,提升了交互的灵活性与精准度。
- 语境控制增强:强化了全局语境理解与文中语境控制能力,使生成的语音在情感表达和上下文连贯性上更加自然。
- 音色复刻与全控:实现了零样本(Zero-shot)音色复刻与全音色控制,能够更快速地适配不同声音风格。
发布状态
目前,StepAudio 2.5 TTS 已全量上线 阶跃星辰开放平台 以及 Step Plan 计划,供开发者及企业用户调用。
