Apple ML Research:通过长时运动嵌入实现高效运动学生成

2026/04/24 08:00阅读量 2

Apple Machine Learning Research 提出一种基于长时运动嵌入的高效运动学生成方法,利用从追踪模型获得的大规模轨迹学习压缩因子为 64 倍的时序嵌入。该方法训练条件流匹配模型生成任务描述或空间提示下的运动潜变量,其生成的运动分布在真实性和多样性上超越了当前最先进视频模型及专用任务方法。该研究解决了全视频合成在探索多种未来可能性时的效率瓶颈问题。

事件概述

Apple Machine Learning Research 团队在 CVPR 2026 发表论文《Learning Long-Term Motion Embeddings for Efficient Kinematics Generation》,提出了一种直接操作长时运动嵌入的新范式,以解决现有视频模型在探索多种未来可能性时效率低下的问题。

核心信息

  • 技术原理
    • 首先从大规模轨迹中学习高度压缩的运动嵌入,时序压缩因子达到 64×
    • 在该嵌入空间中,训练一个条件流匹配模型(conditional flow-matching model),根据任务描述(如文本提示)或空间交互(如空间点击)生成运动潜变量。
  • 性能表现
    • 生成的运动分布能够产出长时长、高真实感的动作。
    • 实验结果表明,该方法在性能上优于当前的**最先进视频模型(state-of-the-art video models)**以及专用的特定任务方法。
  • 应用场景
    • 适用于需要理解场景动态并预测多种可能未来的视觉智能任务。
    • 支持通过文本指令或空间提示精确控制生成的运动目标。

值得关注

该研究通过将复杂的视频生成过程转化为对压缩运动嵌入的操作,显著提升了计算效率,为构建更高效的具身智能和角色动画系统提供了新的技术路径。

来源:Apple Machine Learning Research
返回列表

准备好启动您的定制项目了吗?

现在咨询,即可获得免费的业务梳理与技术架构建议方案。