魔法原子上交会首秀VLA K02大模型，突破具身智能“理解”能力瓶颈

2026/06/15 13:37阅读量 9

魔法原子在第十二届上交会上首次线下展示自研Magic-VLA K02大模型与Magic-Mix世界模型，完成叠衣服、叠盒子等高难度长序任务。模型采用分层式双系统联合架构，将规划与执行解耦，实现了从“指令即动作”到“理解-规划-执行”的能力跃迁，并解决了柔性物体形变、长周期误差累积等行业痛点。

事件概述

在6月13日闭幕的第十二届中国（上海）国际技术进出口交易会上，具身智能企业魔法原子（MagicLab）首次公开发布其全栈核心技术成果：Magic-VLA K02大模型与Magic-Mix世界模型，并进行了真机实操演示。

核心信息

技术架构：Magic-VLA K02采用分层式双系统联合架构。高层系统负责宏观规划，将抽象目标拆解为包含关键结果图像的原子指令，并通过动态记忆机制修正路径；低层系统作为动作执行中枢，融合VLM主干网络与动态专家模块，结合扩散生成技术输出连续、稳定的动作序列。该架构打破了传统VLA模型“指令即动作”的线性限制。
真机演示成果：搭载双模型的机器人成功完成叠衣服（柔性物体连续形变挑战）和叠盒子（多阶段精密操作、容错率极低）等高难度长序任务。面对工作人员随机移动物体、改变光线等动态干扰，机器人能实时感知环境变化并自主调整策略，稳定完成任务。
数据效率突破：Magic-Mix世界模型搭载WAM环境解析引擎与Creator数据生成引擎，可自主合成百万小时级高质量训练数据，将数据生产效率提升万倍，缓解了具身智能行业高质量数据稀缺的瓶颈。
四大核心竞争力：策略可控性（动态记忆解决长程任务进度遗忘）、高阶组合泛化（无需专项数据即可零样本适配新任务）、全域跨本体适配（元数据描述体系兼容多种硬件终端）、高稳定落地部署（分层约束与自适应容错算法应对抓取失败等异常场景）。
训练体系：采用“海量第一人称视角预训练+少量机器人示范对齐”的分层训练方法，经过四阶段训练，在超大算力消耗与终端实时性之间取得平衡。

值得关注

此次线下首秀验证了魔法原子“本体+模型+数据”协同发展的技术路线成熟度。其分层式架构将机器人的智能决策与动作执行解耦，使机器人从单纯的“执行工具”向具备“理解-规划-执行”闭环能力的智能体演进，对工业制造、商业服务及家庭场景的规模化落地具有参考意义。

阅读原文详情

事件概述

核心信息

值得关注

准备好启动您的定制项目了吗？