CVPR 2026 现场：计算机视觉全面进军物理世界，具身智能成为中国军团主场

2026/06/08 10:18阅读量 3

CVPR 2026 在丹佛开幕，投稿量激增至 1.6 万篇，论文录用率约 25%。本届主题全面转向多模态基础模型与具身智能，计算机视觉从“看”走向“行动”。中国高校论文产出强势，上海交大以 46 篇居首。产业方面，腾讯、阿里云、字节跳动等中国巨头赞助顶级席位，MiniMax 等新锐入围白金赞助。Workshop 中，中国团队主导多场议程，小米在 GigaBrain Challenge 真机赛道夺冠，特斯拉与小鹏同台论道。

事件概述

CVPR 2026 于当地时间 6 月 3 日至 4 日开启 Workshop，正会于 6 月 5 日在丹佛科罗拉多会议中心开幕。本届投稿量达 16,092 篇（同比增 24%），录用约 4,090 篇，录用率 25.42%。核心叙事已从图像生成、2D 检测转向“多模态基础模型”与“具身智能”，视觉系统开始主导机器人动作决策。

中国高校论文产出亮眼：上海交大 46 篇、浙大 40 篇、中科大 38 篇、中山大学 36 篇（黑马）、西湖大学仅 4 位学者产出 22 篇，人均效率极高。

核心信息

中国军团：大厂与新锐共筑全栈产业链

丹佛布展的中国公司覆盖互联网、大模型、机器人、智驾：字节、阿里、蚂蚁、腾讯、美团、元戎启行、百度、MiniMax、宇树科技、光轮智能、自变量等。

顶级赞助：腾讯拿下 Ultimate Sponsor；白金赞助包括阿里云、蚂蚁集团、字节跳动、MiniMax。
黄金/白银赞助：苏度科技（Sudo，具身智能）、Linkerbot（灵巧手）、Nexdata（数据）、潞晨科技（Colossal-AI）、百度、美团等。中国企业已构建软硬一体全栈 AI 产业链。

Workshop 关键议题

WDFM-EAI：特斯拉与国内车企同台

特斯拉 Autopilot 负责人 Ashok Elluswamy 披露：FSD 上下文长度从约 10 秒提升至约 30 秒，完整输入/输出架构首次公开，并展示 Robotaxi 避让摔倒骑行者的实况。Tesla 将自动驾驶视为更广泛机器人与具身 AI 平台的一部分（与 Optimus 协同）。
小鹏智能中心负责人刘先明给出明确观点：VLA 与世界模型是物理世界基座模型的两大支柱，非互斥路线。小鹏第二代 VLA 已量产落地，首月用户辅助驾驶里程占比突破 50%，认为“只有能做基座模型的公司才可能实现 L4”。

OpenDriveLab：连续四年主办 Workshop

上海 AI Lab/商汤系团队连续第四年主办，本届主题“从实验室到生活：野外具身智能”。嘉宾包括苏昊（苏度科技）、哈佛助理教授 Yilun Du、UC Berkeley Jiahui Lei 等，讨论物理理解的幻觉、世界模型等前沿议题。

GigaBrain Challenge 2026：中国团队包揽四赛道冠军

极佳视界牵头，联合港大、北大、上海交大、地平线、智元等组织，设仿真 VLA 评测、世界模型评估器、真机操控、物理爪持四赛道。中国团队斩获全部冠军：

小米“my16”模型在 RoboChallenge 真机赛道以 40.89% 成功率夺冠（唯一破 40%），采用“S1/S2 双系统 + 长短期记忆 + 跨本体预训练”架构。小米同时斩获 CVPR 2026 与 ICRA 2026 双料冠军。
电子科技大学获 RoboTwin 仿真赛道冠军，清华大学获世界模型赛道冠军，清华深研院获 PhysClaw 演示赛道冠军。

现场与平行活动

CVPR 首次在 F 展厅推出“AI Demonstrations”环节，近 30 场现场演示让论文变成可交互系统。
无法赴美的欧洲学者在巴黎自发组织 CVPR@Paris 2026 平行活动，香港大学李弘扬教授等分享。

值得关注

计算机视觉与机器人物理边界的加速融合，VLA 模型成为关键路径。
中国在论文产出、产业赞助、竞赛成绩上全面主导，具身智能赛道本土初创公司崭露头角。
特斯拉与小鹏就“VLA vs 世界模型”给出不同但互补的答案，行业加速探索基座模型。

阅读原文详情