通义实验室发布 Fun-ASR1.5:实现方言工业级可用

2026/04/20 18:06阅读量 2

通义实验室正式推出语音识别模型 Fun-ASR1.5,该版本重点突破方言识别能力,达到工业级可用标准。新模型在保持高性能的同时,显著提升了多场景下的方言适配性与准确率,为复杂语音环境提供了更可靠的解决方案。

事件概述

通义实验室发布了新一代语音自动识别(ASR)模型 Fun-ASR1.5。此次更新的核心突破在于大幅增强了方言处理能力,使其从实验阶段迈入“工业级可用”水平。

核心信息

  • 模型版本:Fun-ASR1.5
  • 主要特性:支持多种方言的精准识别,解决了以往方言数据稀缺导致的识别率低问题。
  • 应用场景:适用于需要处理多方言混合或特定区域方言的工业级业务场景。
  • 技术定位:在通用语音识别基础上,通过优化架构与数据策略,实现了方言识别性能的行业领先。

值得关注

该模型的发布标志着中文语音识别技术在覆盖广度上的重要进展,特别是在非普通话场景下的落地应用潜力显著提升,为相关行业的智能化服务提供了新的基础设施支持。

准备好启动您的定制项目了吗?

现在咨询,即可获得免费的业务梳理与技术架构建议方案。