自动驾驶进入模型时代:元戎启行以40B VLA基座重构研发逻辑

元戎启行在NVIDIA GTC大会上提出以约40B参数的VLA(视觉-语言-动作)基座模型重构辅助驾驶系统,旨在解决传统模块化架构难以应对长尾场景的痛点。该方案将数据闭环迭代周期从数天压缩至12小时,并强调车辆规模本身即成为训练资源,推动行业竞争焦点从功能工程转向模型规模与训练效率。尽管面临算力成本、安全验证及极端场景泛化等挑战,这一路径标志着自动驾驶正从工程问题向AI问题深度转型。

事件概述

在2026年3月举办的NVIDIA GTC大会上,自动驾驶公司元戎启行(DeepRoute.ai)展示了其技术路线的重大转变:不再单纯堆砌功能模块,而是试图通过构建统一的基座模型来重构整个辅助驾驶系统。这一举措被视为自动驾驶行业从“工程优化”阶段迈向“模型驱动”阶段的关键信号。

核心信息

1. 技术架构升级:统一感知、理解与决策

  • 基座模型规模:元戎启行推出了一套约40B参数规模的VLA(Vision-Language-Action,视觉-语言-动作)基座模型。
  • 能力整合:该模型旨在统一感知、场景理解、决策规划以及自我评估能力。系统不仅执行驾驶操作,还能理解复杂场景并判断自身表现优劣。
  • 架构收敛:不同于过去拆分多个独立模块的做法,新框架将分散的能力压回一个可持续进化的单一模型中,以应对城市场景的高复杂度。

2. 研发范式变革:迭代速度成为关键变量

  • 数据闭环加速:传统依赖人工参与的数据闭环周期通常以“天”为单位,引入基座模型后,元戎启行声称可将迭代周期压缩至约12小时。
  • 竞争逻辑转移:行业竞争重心从“谁做得更好”转向“谁改得更快”。自动驾驶的研发节奏正接近AI大模型的训练模式。
  • 规模效应:随着模型驱动阶段的到来,车辆数量直接转化为训练资源。模型、数据与算力三者开始深度绑定。

3. 市场现状与目标

  • 交付数据:截至文章发布时,累计交付超过25万辆搭载城市NOA(Navigate on Autopilot)的量产车。
  • 市场份额:在第三方供应商市场中,单月市占率接近40%。
  • 未来目标:计划在2026年实现100万辆的交付量突破。

值得关注

潜在挑战与风险

尽管方向明确,但基于大模型的自动驾驶路径仍面临严峻考验:

  1. 算力与成本压力:40B参数模型的训练属于重资产投入,即便经过蒸馏压缩部署到车端,对算力和成本的敏感度依然是汽车行业的痛点。
  2. 安全与验证标准:当模型具备自我评估能力时,如何确立客观的评估标准?需警惕系统在复杂逻辑中“自洽”而非真正可靠的风险。
  3. 长尾问题解决:大模型虽能优化常见场景,但对于极端、罕见的长尾情况,仅靠扩大模型规模是否有效,行业尚无定论。

行业意义

元戎启行的尝试表明,自动驾驶公司的属性正在发生根本性变化——逐渐演变为AI公司。未来的竞争将不再局限于传感器硬件或规控算法的局部优化,而是比拼模型规模、数据规模以及训练效率。这一路径若成功,其应用边界可能从汽车扩展至Robotaxi、机器人乃至更广泛的具身智能领域。

准备好启动您的定制项目了吗?

现在咨询,即可获得免费的业务梳理与技术架构建议方案。