自动驾驶进入模型时代：元戎启行以40B VLA基座重构研发逻辑

2026/03/18 18:47阅读量 56

元戎启行在NVIDIA GTC大会上提出以约40B参数的VLA（视觉-语言-动作）基座模型重构辅助驾驶系统，旨在解决传统模块化架构难以应对长尾场景的痛点。该方案将数据闭环迭代周期从数天压缩至12小时，并强调车辆规模本身即成为训练资源，推动行业竞争焦点从功能工程转向模型规模与训练效率。尽管面临算力成本、安全验证及极端场景泛化等挑战，这一路径标志着自动驾驶正从工程问题向AI问题深度转型。

事件概述

在2026年3月举办的NVIDIA GTC大会上，自动驾驶公司元戎启行（DeepRoute.ai）展示了其技术路线的重大转变：不再单纯堆砌功能模块，而是试图通过构建统一的基座模型来重构整个辅助驾驶系统。这一举措被视为自动驾驶行业从“工程优化”阶段迈向“模型驱动”阶段的关键信号。

核心信息

1. 技术架构升级：统一感知、理解与决策

基座模型规模：元戎启行推出了一套约40B参数规模的VLA（Vision-Language-Action，视觉-语言-动作）基座模型。
能力整合：该模型旨在统一感知、场景理解、决策规划以及自我评估能力。系统不仅执行驾驶操作，还能理解复杂场景并判断自身表现优劣。
架构收敛：不同于过去拆分多个独立模块的做法，新框架将分散的能力压回一个可持续进化的单一模型中，以应对城市场景的高复杂度。

2. 研发范式变革：迭代速度成为关键变量

数据闭环加速：传统依赖人工参与的数据闭环周期通常以“天”为单位，引入基座模型后，元戎启行声称可将迭代周期压缩至约12小时。
竞争逻辑转移：行业竞争重心从“谁做得更好”转向“谁改得更快”。自动驾驶的研发节奏正接近AI大模型的训练模式。
规模效应：随着模型驱动阶段的到来，车辆数量直接转化为训练资源。模型、数据与算力三者开始深度绑定。

3. 市场现状与目标

交付数据：截至文章发布时，累计交付超过25万辆搭载城市NOA（Navigate on Autopilot）的量产车。
市场份额：在第三方供应商市场中，单月市占率接近40%。
未来目标：计划在2026年实现100万辆的交付量突破。

值得关注

潜在挑战与风险

尽管方向明确，但基于大模型的自动驾驶路径仍面临严峻考验：

算力与成本压力：40B参数模型的训练属于重资产投入，即便经过蒸馏压缩部署到车端，对算力和成本的敏感度依然是汽车行业的痛点。
安全与验证标准：当模型具备自我评估能力时，如何确立客观的评估标准？需警惕系统在复杂逻辑中“自洽”而非真正可靠的风险。
长尾问题解决：大模型虽能优化常见场景，但对于极端、罕见的长尾情况，仅靠扩大模型规模是否有效，行业尚无定论。

行业意义

元戎启行的尝试表明，自动驾驶公司的属性正在发生根本性变化——逐渐演变为AI公司。未来的竞争将不再局限于传感器硬件或规控算法的局部优化，而是比拼模型规模、数据规模以及训练效率。这一路径若成功，其应用边界可能从汽车扩展至Robotaxi、机器人乃至更广泛的具身智能领域。

阅读原文详情