CVPR 2026：计算机视觉与机器人融合再加速，中国军团全面崛起

2026/06/05 18:47阅读量 3

CVPR 2026 在丹佛开幕，论文投稿量达 16,092 篇，录用率 25.42%，主题从 2D 感知全面转向多模态基础模型与具身智能。中国高校和企业在论文产出、赞助商阵容及 Workshop 话语权上表现突出，小米等团队在真机挑战赛中包揽全部冠军。

事件概述

CVPR 2026 于 2026 年 6 月 3 日至 5 日在丹佛科罗拉多会议中心举行，与同期在维也纳举办的 ICRA 2026 形成罕见的“双城赶场”现象。本届会议论文投稿量达 16,092 篇（同比激增 24%），最终录用约 4,090 篇，录用率 25.42%。核心叙事已从图像生成、2D 检测转向多模态基础模型与具身智能，视觉系统正从“感知”向“行动”中枢演进。

核心信息

中国高校论文产出亮眼：高校论文接收 Top 10 中中国占八席——上海交通大学 46 篇居首、浙江大学 40 篇、中国科学技术大学 38 篇、中山大学 36 篇（黑马），西湖大学 4 位学者产出 22 篇，人均效率最高。

中国军团赞助与参展：腾讯获 Ultimate Sponsor；白金赞助商含阿里云、蚂蚁集团、字节跳动、MiniMax；黄金与白银赞助商包括百度、美团、苏度科技（苏昊教授创办）、Linkerbot、Nexdata（VLM 数据集）、潞晨科技（Colossal-AI）等，覆盖算力、模型、数据集、本体硬件全链条。

Workshop 话语权争夺：

WDFM-EAI Workshop：特斯拉 Autopilot 负责人 Ashok Elluswamy 展示了 FSD 上下文长度从约 10 秒提升至约 30 秒，并播放 Robotaxi 避让摔落骑行者的视频。小鹏通用智能中心负责人刘先明提出 VLA 与世界模型并非竞争，而是物理世界基座模型的两大支柱，并透露小鹏第二代 VLA 已量产，推送首月用户辅助驾驶里程占比突破 50%。
上海 AI Lab/商汤系主办 EmbodiedAIinLife Workshop：连续第四年举办，嘉宾包括苏昊（物理理解的幻觉）、Yilun Du（世界模型与具身智能）等，并设置辩论环节。
GigaBrain Challenge 2026：设四个赛道（仿真 VLA、世界模型评估、真机操控、物理爪持），中国团队包揽全部冠军。小米在真机赛道以 40.89% 成功率夺冠（唯一破 40%），同时斩获 ICRA 2026 冠军，成双料冠军；其模型“my16”采用 S1/S2 双系统 + 长短期记忆 + 跨本体预训练架构。

展厅新尝试：CVPR 首次开设 F 展厅“AI Demonstrations”，近 30 场现场演示将论文转化为可交互系统。

平行活动：欧洲学者在巴黎自发组织 CVPR@Paris 2026，邀请多位 CV 领域顶尖学者，包括香港大学李弘扬教授。

值得关注

纯视觉与端到端路线在自动驾驶和机器人领域的加速落地，VLA 与世界模型融合成为产业共识。
中国团队从“参会”走向“设局”，在 Workshop 组织和竞赛中占据主导，产业链协同效应显现。
真机竞赛的高要求（30 个超难度任务、连续 10 次无干扰测试）凸显泛化性仍是具身智能的核心挑战，小米的突破为跨本体预训练提供了参考路径。

阅读原文详情

事件概述

核心信息

值得关注

准备好启动您的定制项目了吗？