DeepSeek V4核心作者阮翀加盟元戎,详解40B基座VLA模型如何提效10倍
2026/04/26 12:16阅读量 2
前DeepSeek核心成员、V4论文作者之一阮翀出任元戎启行首席科学家,首次公开分享其利用40B参数规模VLA(视觉-语言-动作)基座模型重塑自动驾驶研发流程的实践。该方案将大模型拆解为驾驶、分析、评估三个角色,通过数据表征优化、质量快速评估及云端虚拟环境测试,将模型迭代周期从百小时级缩短至十余小时,实现研发效率提升10倍。阮翀指出,物理AI的核心在于构建“现实反馈闭环”,并认为当前多模态负责人转向具身智能是出于对技术边际收益递减的规避及对未成熟领域的使命感。
事件概述
前DeepSeek核心成员、DeepSeek VL2通讯作者及V4论文作者之一阮翀,正式以元戎启行首席科学家身份亮相北京车展。他详细阐述了元戎如何利用40B参数规模的VLA(Vision-Language-Action Model)基座模型,重构自动驾驶的数据闭环与模型迭代体系,实现了研发效率的显著跃升。
核心信息:40B基座VLA架构与落地实践
元戎启行的基座模型并非单一功能模块,而是被设计为一个可分化出多个版本的统一系统,具体拆分为三个协同角色:
- 驾驶模型(AI司机):负责具体的驾驶决策与控制。
- 分析模型(AI分析员):负责解释和推理AI司机的决策逻辑。
- 评估模型(AI教练):负责评估驾驶表现并提供修正建议。
三大提效场景
阮翀通过三个具体案例展示了该基座模型如何解决传统自动驾驶研发的痛点:
-
数据表征与闭环前置
- 传统痛点:依赖“先训练后发现问题”的滞后模式,难以精准定位数据缺口。
- 改进方案:利用基座模型在训练前对数据进行深度表征与归类,提前识别场景分布不均问题,指导数据配比调整,实现数据驱动的主动优化。
-
数据质量快速评估
- 传统痛点:需通过长周期的模型训练结果反推数据质量,迭代缓慢。
- 改进方案:基于庞大的基座模型进行简单微调,即可直接评估数据质量,大幅缩短反馈周期。
-
云端虚拟环境评估
- 传统痛点:依赖路测(实车更新、跟车实测、回传数据),耗时费力且成本高。
- 改进方案:利用云端虚拟环境模拟真实路况,快速判断模型表现并进行修正。
关键成果
- 迭代速度:模型版本迭代时间从过去的100多个小时缩短至十几个小时,整体研发效率提升约10倍。
- 行业趋势:标志着AI正从“被训练的结果”转变为“训练系统本身的组成部分”,呈现出自我进化的特征。
值得关注:阮翀关于物理AI的深度思考
在圆桌讨论中,阮翀分享了转型物理AI(Physical AI)的动机及对行业的观察:
- 物理AI的定义:狭义上指具备现实载体(如机械手、车辆)并能获得现实世界反馈的系统;广义上则强调“闭环”机制,即系统能根据反馈(如编译器报错、药物性质预测结果)不断自我修正与进化。
- 当前瓶颈:视觉模型在空间方位感知(如区分左右、内外)方面仍存在显著短板,导致行为异常。
- 转型动因:
- 避免边际收益递减:LLM领域已相对成熟,而多模态与具身智能尚处早期,更具探索价值。
- 使命感驱动:倾向于选择那些“若不做则世界无差别”之外的领域,承担更多责任。
- 安全观点:赞同Harness(约束AI边界的系统工程)概念,认为必须通过法律、规章及技术工具主动控制AI边界,而非单纯依赖其“性本善”。
