CVPR 2026 现场:计算机视觉全面进军物理世界,具身智能成为中国军团主场

2026/06/08 10:18阅读量 3

CVPR 2026 在丹佛开幕,投稿量激增至 1.6 万篇,论文录用率约 25%。本届主题全面转向多模态基础模型与具身智能,计算机视觉从“看”走向“行动”。中国高校论文产出强势,上海交大以 46 篇居首。产业方面,腾讯、阿里云、字节跳动等中国巨头赞助顶级席位,MiniMax 等新锐入围白金赞助。Workshop 中,中国团队主导多场议程,小米在 GigaBrain Challenge 真机赛道夺冠,特斯拉与小鹏同台论道。

事件概述

CVPR 2026 于当地时间 6 月 3 日至 4 日开启 Workshop,正会于 6 月 5 日在丹佛科罗拉多会议中心开幕。本届投稿量达 16,092 篇(同比增 24%),录用约 4,090 篇,录用率 25.42%。核心叙事已从图像生成、2D 检测转向“多模态基础模型”与“具身智能”,视觉系统开始主导机器人动作决策。

中国高校论文产出亮眼:上海交大 46 篇、浙大 40 篇、中科大 38 篇、中山大学 36 篇(黑马)、西湖大学仅 4 位学者产出 22 篇,人均效率极高。

核心信息

中国军团:大厂与新锐共筑全栈产业链

丹佛布展的中国公司覆盖互联网、大模型、机器人、智驾:字节、阿里、蚂蚁、腾讯、美团、元戎启行、百度、MiniMax、宇树科技、光轮智能、自变量等。

  • 顶级赞助:腾讯拿下 Ultimate Sponsor;白金赞助包括阿里云、蚂蚁集团、字节跳动、MiniMax。
  • 黄金/白银赞助:苏度科技(Sudo,具身智能)、Linkerbot(灵巧手)、Nexdata(数据)、潞晨科技(Colossal-AI)、百度、美团等。中国企业已构建软硬一体全栈 AI 产业链。

Workshop 关键议题

WDFM-EAI:特斯拉与国内车企同台

  • 特斯拉 Autopilot 负责人 Ashok Elluswamy 披露:FSD 上下文长度从约 10 秒提升至约 30 秒,完整输入/输出架构首次公开,并展示 Robotaxi 避让摔倒骑行者的实况。Tesla 将自动驾驶视为更广泛机器人与具身 AI 平台的一部分(与 Optimus 协同)。
  • 小鹏智能中心负责人刘先明给出明确观点:VLA 与世界模型是物理世界基座模型的两大支柱,非互斥路线。小鹏第二代 VLA 已量产落地,首月用户辅助驾驶里程占比突破 50%,认为“只有能做基座模型的公司才可能实现 L4”。

OpenDriveLab:连续四年主办 Workshop

上海 AI Lab/商汤系团队连续第四年主办,本届主题“从实验室到生活:野外具身智能”。嘉宾包括苏昊(苏度科技)、哈佛助理教授 Yilun Du、UC Berkeley Jiahui Lei 等,讨论物理理解的幻觉、世界模型等前沿议题。

GigaBrain Challenge 2026:中国团队包揽四赛道冠军

极佳视界牵头,联合港大、北大、上海交大、地平线、智元等组织,设仿真 VLA 评测、世界模型评估器、真机操控、物理爪持四赛道。中国团队斩获全部冠军:

  • 小米“my16”模型在 RoboChallenge 真机赛道以 40.89% 成功率夺冠(唯一破 40%),采用“S1/S2 双系统 + 长短期记忆 + 跨本体预训练”架构。小米同时斩获 CVPR 2026 与 ICRA 2026 双料冠军。
  • 电子科技大学获 RoboTwin 仿真赛道冠军,清华大学获世界模型赛道冠军,清华深研院获 PhysClaw 演示赛道冠军。

现场与平行活动

  • CVPR 首次在 F 展厅推出“AI Demonstrations”环节,近 30 场现场演示让论文变成可交互系统。
  • 无法赴美的欧洲学者在巴黎自发组织 CVPR@Paris 2026 平行活动,香港大学李弘扬教授等分享。

值得关注

  • 计算机视觉与机器人物理边界的加速融合,VLA 模型成为关键路径。
  • 中国在论文产出、产业赞助、竞赛成绩上全面主导,具身智能赛道本土初创公司崭露头角。
  • 特斯拉与小鹏就“VLA vs 世界模型”给出不同但互补的答案,行业加速探索基座模型。

准备好启动您的定制项目了吗?

现在咨询,即可获得免费的业务梳理与技术架构建议方案。