蚂蚁灵波开源LingBot-World-Fast:世界模型实现移动端实时交互

2026/04/27 14:42阅读量 3

蚂蚁灵波科技开源了实时世界模型LingBot-World-Fast,支持在480P分辨率下以16fps生成视频,端到端延迟低于1秒。该模型已集成至蚂蚁灵光App,允许普通用户通过上传图片在手机端实时漫游生成的3D场景。此外,开发者可基于开源代码进行本地部署,利用其持续生成和动态控制能力辅助具身智能训练及游戏开发。

事件概述

4月27日,蚂蚁集团旗下全模态AI助手“灵光”App上线“体验世界模型”功能,标志着世界模型首次以移动端产品形态面向普通用户开放。支撑该体验的核心技术是蚂蚁灵波科技同步开源的LingBot-World-Fast模型。

核心性能指标

  • 实时生成能力:在480P分辨率下可实现16 fps(帧率)的实时生成。
  • 交互延迟:端到端交互延迟控制在1秒以内
  • 生成特性:具备通用性、长时序一致性及高动态场景表现能力。

技术实现与优化

为实现实时交互,LingBot-World-Fast采用了专门的后训练优化方案:

  • 增量生成机制:在生成过程中仅聚焦新增画面内容,不再重复计算已稳定的部分,从而显著提升效率并保障画面质量与时序连贯性。
  • 多模态操控:支持键盘、鼠标实时操控视角与移动,同时可通过文本提示(Prompt)随时改变环境状态(如调整天气、切换风格)或触发局部事件。

应用场景与价值

  • 普通用户:上传单张图片即可在手机端生成60秒的3D世界,以第一人称视角进入并漫游,无需本地部署或复杂配置。
  • 具身智能研发:提供多样化的虚拟训练环境,帮助机器人在数字世界中进行场景理解、动作学习和任务演练。
  • 游戏与内容创作:降低交互式内容原型制作门槛,提升从创意到体验的转化效率。

开源与获取渠道

  • 发布背景:继今年1月开源LingBot-World-Base版本后,此次发布的Fast版本进一步解决了实时性问题。
  • 获取方式:模型与代码已在Hugging FaceModel Scope平台完整开放。普通用户可直接通过灵光App体验,开发者与研究者可进行本地部署与二次开发。

准备好启动您的定制项目了吗?

现在咨询,即可获得免费的业务梳理与技术架构建议方案。