前OpenAI研究负责人翁荔创业模型首秀，与面壁智能技术路径惊人一致

2026/05/12 21:06阅读量 18

Thinking Machines Lab（TML）发布全双工实时对话AI愿景，但面壁智能的MiniCPM-o 4.5早在三个月前就已开源实现同样技术。双方均旨在打破“回合制”交互，采用时间对齐的流式处理框架，核心能力高度重合。面壁智能更早交付开源模型，展示了中国AI团队在关键路径上的领先能力。

事件概述

由前OpenAI应用研究负责人翁荔（Lilian Weng）创立的Thinking Machines Lab（TML）近日首次公布技术愿景，核心目标是实现与人“全双工”实时对话的AI模型。然而，TML展示的Demo效果与2026年2月面壁智能开源发布的MiniCPM-o 4.5高度相似，后者同样实现了“边看边听边说”的全模态实时交互能力。

核心信息

技术方向共识：双方共同挑战延续至今的“回合制”交互范式，即用户说完等AI应答的对讲机模式。TML与面壁智能均主张将交互升级为“全双工”流式处理——AI可同时听、看、思考并回应，甚至打断或补充。
框架高度重合：面壁智能提出“Omni-Flow”框架，将连续音视频流切成毫秒级片段，同一时间片内的视觉、听觉、文本token打包后按时间排序喂给模型。TML提出“基于时间对齐的微轮次”概念，原理如出一辙，同样是多模态信息流切碎并沿共享时间轴对齐融合。
能力实现一致：基于上述框架，两者均实现了两个关键能力：（1）实时感知环境并主动描述；（2）在对话中支持打断与自然插话。TML的公开演示与面壁智能2月已发布的开源模型效果几乎一致。
时间与交付差异：面壁智能的MiniCPM-o 4.5于2026年2月正式开源，TML仅在3个月后公布概念愿景。前者已将完整技术报告和开源代码交付社区，后者尚处于演示阶段。大模型领域三个月的时间差以及“开源实物”与“概念展示”的差距，已明确区分出先行者与验证者。

值得关注

此次“技术撞车”验证了全双工实时交互作为下一代AI交互标准路径的可行性。面壁智能的先行与开源精神证明了中国AI团队在关键方向上的前瞻布局与工程落地能力，而翁荔团队的全球影响力则为该技术方向带来更多行业关注。双方共同推动的交互范式变革正在从概念走向现实。

阅读原文详情

事件概述

核心信息

值得关注

准备好启动您的定制项目了吗？