神秘「欢乐马」模型霸榜视频生成,阿里淘天团队或为幕后推手

2026/04/09 17:38阅读量 30

一款名为 HappyHorse-1.0(昵称“欢乐马”)的神秘视频生成模型在 Artificial Analysis 的 Video Arena 榜单中全面登顶,其 Elo 分数断层领先于 Seedance 2.0 和可灵。该模型据传由阿里淘天集团未来生活实验室张迪团队研发,采用 40 层单流 Transformer 架构,支持原生音视频同步及多语言输入,并计划完全开源。目前官方尚未发布技术报告,但多方消息指向其将于近期正式发布。

事件概述

一款代号为 HappyHorse-1.0(社区昵称“欢乐马”)的视频生成模型悄然崛起,在权威评测平台 Artificial AnalysisVideo Arena 排行榜上实现全面霸榜,力压此前表现强劲的 Seedance 2.0 和国产模型 可灵。该模型被广泛认为出自阿里旗下淘天集团未来生活实验室,由前快手可灵项目核心负责人张迪领衔研发。

核心数据与性能表现

根据实时榜单数据,HappyHorse-1.0 在多个赛道展现出压倒性优势:

  • 文本转视频(无音频):Elo 分数达到 1375,以约 100 分的巨大优势甩开第二名 Seedance 2.0。值得注意的是,从第二名到第十名的分差总和仅为 50 分左右,显示出其断层式领先。
  • 图像转视频(无音频):刷新历史纪录,Elo 分数高达 1409
  • 有音频赛道:同样拿下全球第一,超越 Seedance 2.0。

盲测反馈:基于数千名真实用户的盲测对比机制,用户在不知情的情况下多次优先选择 HappyHorse-1.0 生成的视频。实测案例显示,其在画面真实感、镜头切换流畅度、人物纹理还原及氛围营造上均优于竞品(如 Pyramid-Flow、Veo 3.1 Lite、PixVerse V6)。

技术架构与特性

据现有信息梳理,HappyHorse-1.0 的技术突破点如下:

  • 架构设计:采用 40 层单流 Transformer 架构。
  • 生成效率:仅需 8 步去噪 即可输出 1080P 视频;在 H100 显卡上生成 5 秒片段耗时约 38 秒,推理速度显著提升。
  • 核心能力:原生支持 音视频同步生成,引入 多模态统一建模无 CFG 引导生成 技术。
  • 语言支持:原生支持中文(含粤语)、英语、日语、韩语、德语、法语。
  • 开源计划:传闻将 完全开源,涵盖基础模型、蒸馏模型、超分模型及推理代码。

背景与发布时间

  • 研发团队:主要指向 阿里淘天集团未来生活实验室。负责人 张迪(上海交通大学本硕,阿里 P11 职级)曾主导快手可灵大模型的底层架构研发,后加入 B 站,于 2025 年 11 月重返阿里负责该实验室。
  • 当前状态:截至目前,该模型暂无官方网站、技术报告或公开代码库,市面上出现的官网已被证实为假冒。
  • 发布时间:多方消息称团队正在加紧开发,预计于 4 月 10 日 正式发布。

准备好启动您的定制项目了吗?

现在咨询,即可获得免费的业务梳理与技术架构建议方案。