前OpenAI研究负责人翁荔创业模型首秀,与面壁智能技术路径惊人一致

2026/05/12 21:06阅读量 18

Thinking Machines Lab(TML)发布全双工实时对话AI愿景,但面壁智能的MiniCPM-o 4.5早在三个月前就已开源实现同样技术。双方均旨在打破“回合制”交互,采用时间对齐的流式处理框架,核心能力高度重合。面壁智能更早交付开源模型,展示了中国AI团队在关键路径上的领先能力。

事件概述

由前OpenAI应用研究负责人翁荔(Lilian Weng)创立的Thinking Machines Lab(TML)近日首次公布技术愿景,核心目标是实现与人“全双工”实时对话的AI模型。然而,TML展示的Demo效果与2026年2月面壁智能开源发布的MiniCPM-o 4.5高度相似,后者同样实现了“边看边听边说”的全模态实时交互能力。

核心信息

  • 技术方向共识:双方共同挑战延续至今的“回合制”交互范式,即用户说完等AI应答的对讲机模式。TML与面壁智能均主张将交互升级为“全双工”流式处理——AI可同时听、看、思考并回应,甚至打断或补充。

  • 框架高度重合:面壁智能提出“Omni-Flow”框架,将连续音视频流切成毫秒级片段,同一时间片内的视觉、听觉、文本token打包后按时间排序喂给模型。TML提出“基于时间对齐的微轮次”概念,原理如出一辙,同样是多模态信息流切碎并沿共享时间轴对齐融合。

  • 能力实现一致:基于上述框架,两者均实现了两个关键能力:(1)实时感知环境并主动描述;(2)在对话中支持打断与自然插话。TML的公开演示与面壁智能2月已发布的开源模型效果几乎一致。

  • 时间与交付差异:面壁智能的MiniCPM-o 4.5于2026年2月正式开源,TML仅在3个月后公布概念愿景。前者已将完整技术报告和开源代码交付社区,后者尚处于演示阶段。大模型领域三个月的时间差以及“开源实物”与“概念展示”的差距,已明确区分出先行者与验证者。

值得关注

此次“技术撞车”验证了全双工实时交互作为下一代AI交互标准路径的可行性。面壁智能的先行与开源精神证明了中国AI团队在关键方向上的前瞻布局与工程落地能力,而翁荔团队的全球影响力则为该技术方向带来更多行业关注。双方共同推动的交互范式变革正在从概念走向现实。

准备好启动您的定制项目了吗?

现在咨询,即可获得免费的业务梳理与技术架构建议方案。