CVPR 2026:计算机视觉与机器人融合再加速,中国军团全面崛起
2026/06/05 18:47阅读量 3
CVPR 2026 在丹佛开幕,论文投稿量达 16,092 篇,录用率 25.42%,主题从 2D 感知全面转向多模态基础模型与具身智能。中国高校和企业在论文产出、赞助商阵容及 Workshop 话语权上表现突出,小米等团队在真机挑战赛中包揽全部冠军。
事件概述
CVPR 2026 于 2026 年 6 月 3 日至 5 日在丹佛科罗拉多会议中心举行,与同期在维也纳举办的 ICRA 2026 形成罕见的“双城赶场”现象。本届会议论文投稿量达 16,092 篇(同比激增 24%),最终录用约 4,090 篇,录用率 25.42%。核心叙事已从图像生成、2D 检测转向多模态基础模型与具身智能,视觉系统正从“感知”向“行动”中枢演进。
核心信息
中国高校论文产出亮眼:高校论文接收 Top 10 中中国占八席——上海交通大学 46 篇居首、浙江大学 40 篇、中国科学技术大学 38 篇、中山大学 36 篇(黑马),西湖大学 4 位学者产出 22 篇,人均效率最高。
中国军团赞助与参展:腾讯获 Ultimate Sponsor;白金赞助商含阿里云、蚂蚁集团、字节跳动、MiniMax;黄金与白银赞助商包括百度、美团、苏度科技(苏昊教授创办)、Linkerbot、Nexdata(VLM 数据集)、潞晨科技(Colossal-AI)等,覆盖算力、模型、数据集、本体硬件全链条。
Workshop 话语权争夺:
- WDFM-EAI Workshop:特斯拉 Autopilot 负责人 Ashok Elluswamy 展示了 FSD 上下文长度从约 10 秒提升至约 30 秒,并播放 Robotaxi 避让摔落骑行者的视频。小鹏通用智能中心负责人刘先明提出 VLA 与世界模型并非竞争,而是物理世界基座模型的两大支柱,并透露小鹏第二代 VLA 已量产,推送首月用户辅助驾驶里程占比突破 50%。
- 上海 AI Lab/商汤系主办 EmbodiedAIinLife Workshop:连续第四年举办,嘉宾包括苏昊(物理理解的幻觉)、Yilun Du(世界模型与具身智能)等,并设置辩论环节。
- GigaBrain Challenge 2026:设四个赛道(仿真 VLA、世界模型评估、真机操控、物理爪持),中国团队包揽全部冠军。小米在真机赛道以 40.89% 成功率夺冠(唯一破 40%),同时斩获 ICRA 2026 冠军,成双料冠军;其模型“my16”采用 S1/S2 双系统 + 长短期记忆 + 跨本体预训练架构。
展厅新尝试:CVPR 首次开设 F 展厅“AI Demonstrations”,近 30 场现场演示将论文转化为可交互系统。
平行活动:欧洲学者在巴黎自发组织 CVPR@Paris 2026,邀请多位 CV 领域顶尖学者,包括香港大学李弘扬教授。
值得关注
- 纯视觉与端到端路线在自动驾驶和机器人领域的加速落地,VLA 与世界模型融合成为产业共识。
- 中国团队从“参会”走向“设局”,在 Workshop 组织和竞赛中占据主导,产业链协同效应显现。
- 真机竞赛的高要求(30 个超难度任务、连续 10 次无干扰测试)凸显泛化性仍是具身智能的核心挑战,小米的突破为跨本体预训练提供了参考路径。
