通义实验室发布 Fun-ASR1.5:实现方言工业级可用
2026/04/20 18:06阅读量 2
通义实验室正式推出语音识别模型 Fun-ASR1.5,该版本重点突破方言识别能力,达到工业级可用标准。新模型在保持高性能的同时,显著提升了多场景下的方言适配性与准确率,为复杂语音环境提供了更可靠的解决方案。
事件概述
通义实验室发布了新一代语音自动识别(ASR)模型 Fun-ASR1.5。此次更新的核心突破在于大幅增强了方言处理能力,使其从实验阶段迈入“工业级可用”水平。
核心信息
- 模型版本:Fun-ASR1.5
- 主要特性:支持多种方言的精准识别,解决了以往方言数据稀缺导致的识别率低问题。
- 应用场景:适用于需要处理多方言混合或特定区域方言的工业级业务场景。
- 技术定位:在通用语音识别基础上,通过优化架构与数据策略,实现了方言识别性能的行业领先。
值得关注
该模型的发布标志着中文语音识别技术在覆盖广度上的重要进展,特别是在非普通话场景下的落地应用潜力显著提升,为相关行业的智能化服务提供了新的基础设施支持。
