Luma Uni-1.1开放API,华人15人团队AI生图模型冲进全球前三
2026/05/06 17:24阅读量 2
5月6日,Luma AI正式开放图像模型Uni-1.1的API。在Arena.ai用户盲测榜单上,Uni-1.1及Max版本冲至全球第三,仅次于OpenAI的gpt-image-2和Google的nano-banana-2。该模型将推理与生成统一于自回归Transformer架构,支持多参考图约束和句子级编辑,2K分辨率单图最低$0.0404。阿迪达斯、马自达、阳狮集团等已签约使用。核心研究团队不到15人,由清华本科/斯坦福博士宋佳铭(DDIM作者)和斯坦福本博沈博魁(CVPR 2018最佳论文得主)领衔。
核心事件
2026年5月6日,Luma AI宣布开放Uni-1.1 API。同日,第三方机构Arena.ai更新图像生成榜单,Luma Uni-1.1与Uni-1.1-Max双双进入全球前三,仅次于OpenAI和Google,超越Microsoft AI、Reve、xAI等。该榜单基于用户盲测ELO评分,无官方数据干预。
技术亮点:推理与生成统一
Uni-1.1采用decoder-only自回归Transformer,文本token与图像token共享同一序列,实现跨模态同步推理与生成。API提供两个端点:
- Reasoning端点:解构指令、规划构图、锁定品牌/角色约束;
- Generation端点:完成像素渲染。
关键能力:
- 单次调用最多支持9张参考图联合输入,将品牌形象、产品、地域元素作为模型级硬约束。
- 句子级编辑:按句修改图像,默认保留其他元素,主体一致性稳定。
- 复杂版面生成:单图可输出完整新闻网页(含报头、导航、正文、广告位),英文文本真实可读。
定价与企业落地
- 价格:2K分辨率单图最低$0.0404(约0.2755元),延迟与价格均低于同类模型一半。
- 已签约客户:
- 阳狮集团、Serviceplan将Luma Agents部署于广告全流程。某品牌原预算1500万美元、周期一年的广告campaign,用40小时、不到2万美元完成多国本地化并过审。
- 阿迪达斯、马自达接入品牌内容流水线。
- Envato、Comfy、Runware、Flora、Krea、Magnific、Fal、LovArt等平台已基于API集成。
三个已验证应用方向
- 广告本地化:单API调用支持多语言(含中文、阿拉伯文)渲染,避免重拍。
- 电商产品可视化:最低$0.0404/图,实现按页、用户、地域实时生成产品图。
- 角色与IP一致性:多参考图+句子编辑,确保角色跨场景身份稳定。
团队与路线图
核心研究团队不足15人,由两位华人学者领衔:
- 宋佳铭:清华本科、斯坦福博士,扩散模型采样加速奠基工作DDIM作者。
- 沈博魁:斯坦福本博,CVPR 2018最佳论文奖得主。
Luma CEO Amit Jain表示,统一智能的价值在于模型既能理解又能生成,使AI具备端到端创意工作能力。下一步计划将同一框架扩展至视频、语音和交互式世界模拟。
