魔法原子上交会首秀VLA K02大模型,突破具身智能“理解”能力瓶颈
魔法原子在第十二届上交会上首次线下展示自研Magic-VLA K02大模型与Magic-Mix世界模型,完成叠衣服、叠盒子等高难度长序任务。模型采用分层式双系统联合架构,将规划与执行解耦,实现了从“指令即动作”到“理解-规划-执行”的能力跃迁,并解决了柔性物体形变、长周期误差累积等行业痛点。
事件概述
在6月13日闭幕的第十二届中国(上海)国际技术进出口交易会上,具身智能企业魔法原子(MagicLab)首次公开发布其全栈核心技术成果:Magic-VLA K02大模型与Magic-Mix世界模型,并进行了真机实操演示。
核心信息
-
技术架构:Magic-VLA K02采用分层式双系统联合架构。高层系统负责宏观规划,将抽象目标拆解为包含关键结果图像的原子指令,并通过动态记忆机制修正路径;低层系统作为动作执行中枢,融合VLM主干网络与动态专家模块,结合扩散生成技术输出连续、稳定的动作序列。该架构打破了传统VLA模型“指令即动作”的线性限制。
-
真机演示成果:搭载双模型的机器人成功完成叠衣服(柔性物体连续形变挑战)和叠盒子(多阶段精密操作、容错率极低)等高难度长序任务。面对工作人员随机移动物体、改变光线等动态干扰,机器人能实时感知环境变化并自主调整策略,稳定完成任务。
-
数据效率突破:Magic-Mix世界模型搭载WAM环境解析引擎与Creator数据生成引擎,可自主合成百万小时级高质量训练数据,将数据生产效率提升万倍,缓解了具身智能行业高质量数据稀缺的瓶颈。
-
四大核心竞争力:策略可控性(动态记忆解决长程任务进度遗忘)、高阶组合泛化(无需专项数据即可零样本适配新任务)、全域跨本体适配(元数据描述体系兼容多种硬件终端)、高稳定落地部署(分层约束与自适应容错算法应对抓取失败等异常场景)。
-
训练体系:采用“海量第一人称视角预训练+少量机器人示范对齐”的分层训练方法,经过四阶段训练,在超大算力消耗与终端实时性之间取得平衡。
值得关注
此次线下首秀验证了魔法原子“本体+模型+数据”协同发展的技术路线成熟度。其分层式架构将机器人的智能决策与动作执行解耦,使机器人从单纯的“执行工具”向具备“理解-规划-执行”闭环能力的智能体演进,对工业制造、商业服务及家庭场景的规模化落地具有参考意义。
