豆包APP升级全双工语音模型Seeduplex,显著提升抗干扰与低时延体验

2026/04/10 14:36阅读量 30

豆包APP实时语音通话功能已上线原生全双工端到端语音大模型Seeduplex。该模型在复杂声学场景下实现了精准抗干扰与动态判停,有效解决了背景噪音误打断及对话“抢话”问题。实测显示,升级后的响应时延降低,对话节奏更贴近自然交流,尤其在多人交谈等高频互动场景中表现突出。

事件概述

近日,豆包APP对其实时语音通话功能进行了重大升级,正式引入原生全双工端到端语音大模型Seeduplex。此次更新旨在解决传统语音交互中存在的延迟高、易受干扰及对话不自然等痛点。

核心能力升级

  • 精准抗干扰:Seeduplex 能够在复杂声学环境下(如餐厅、展览等存在多人交谈和背景噪音的场景)实现精准的语音识别。系统增强了对无关声音的过滤能力,大幅降低了因环境噪音或旁人说话导致的误打断和误回复现象。
  • 动态判停与自然交互:针对人类对话中“停顿不等于结束”的特性,新模型结合语音与语义信息进行综合判断。这一机制有效减少了AI在用户思考时的“抢话”行为,使对话节奏更加流畅自然。
  • 低时延响应:升级后,系统的对话响应时延进一步降低。在接龙、飞花令等需要快速互动的场景中,表现尤为明显,提升了整体交互效率。

使用方式

目前,该功能已在豆包APP上线。用户可通过点击应用内的“打电话”按钮,直接开启实时语音通话功能进行体验。

准备好启动您的定制项目了吗?

现在咨询,即可获得免费的业务梳理与技术架构建议方案。