Luma Uni-1.1开放API,华人15人团队AI生图模型冲进全球前三

2026/05/06 17:24阅读量 2

5月6日,Luma AI正式开放图像模型Uni-1.1的API。在Arena.ai用户盲测榜单上,Uni-1.1及Max版本冲至全球第三,仅次于OpenAI的gpt-image-2和Google的nano-banana-2。该模型将推理与生成统一于自回归Transformer架构,支持多参考图约束和句子级编辑,2K分辨率单图最低$0.0404。阿迪达斯、马自达、阳狮集团等已签约使用。核心研究团队不到15人,由清华本科/斯坦福博士宋佳铭(DDIM作者)和斯坦福本博沈博魁(CVPR 2018最佳论文得主)领衔。

核心事件

2026年5月6日,Luma AI宣布开放Uni-1.1 API。同日,第三方机构Arena.ai更新图像生成榜单,Luma Uni-1.1与Uni-1.1-Max双双进入全球前三,仅次于OpenAI和Google,超越Microsoft AI、Reve、xAI等。该榜单基于用户盲测ELO评分,无官方数据干预。

技术亮点:推理与生成统一

Uni-1.1采用decoder-only自回归Transformer,文本token与图像token共享同一序列,实现跨模态同步推理与生成。API提供两个端点:

  • Reasoning端点:解构指令、规划构图、锁定品牌/角色约束;
  • Generation端点:完成像素渲染。

关键能力:

  • 单次调用最多支持9张参考图联合输入,将品牌形象、产品、地域元素作为模型级硬约束。
  • 句子级编辑:按句修改图像,默认保留其他元素,主体一致性稳定。
  • 复杂版面生成:单图可输出完整新闻网页(含报头、导航、正文、广告位),英文文本真实可读。

定价与企业落地

  • 价格:2K分辨率单图最低$0.0404(约0.2755元),延迟与价格均低于同类模型一半。
  • 已签约客户
    • 阳狮集团、Serviceplan将Luma Agents部署于广告全流程。某品牌原预算1500万美元、周期一年的广告campaign,用40小时、不到2万美元完成多国本地化并过审。
    • 阿迪达斯、马自达接入品牌内容流水线。
    • Envato、Comfy、Runware、Flora、Krea、Magnific、Fal、LovArt等平台已基于API集成。

三个已验证应用方向

  1. 广告本地化:单API调用支持多语言(含中文、阿拉伯文)渲染,避免重拍。
  2. 电商产品可视化:最低$0.0404/图,实现按页、用户、地域实时生成产品图。
  3. 角色与IP一致性:多参考图+句子编辑,确保角色跨场景身份稳定。

团队与路线图

核心研究团队不足15人,由两位华人学者领衔:

  • 宋佳铭:清华本科、斯坦福博士,扩散模型采样加速奠基工作DDIM作者。
  • 沈博魁:斯坦福本博,CVPR 2018最佳论文奖得主。

Luma CEO Amit Jain表示,统一智能的价值在于模型既能理解又能生成,使AI具备端到端创意工作能力。下一步计划将同一框架扩展至视频、语音和交互式世界模拟

准备好启动您的定制项目了吗?

现在咨询,即可获得免费的业务梳理与技术架构建议方案。