Seedance 2.5 正式发布，支持 30 秒视频生成与 50 路多参考输入

2026/06/23 17:36阅读量 5

火山引擎在 2026 FORCE 大会上发布豆包大模型 2.1 Pro 及多项 AI 模型。Seedance 2.5 实现单条视频最长 30 秒、支持 50 个全模态素材联合输入，并具备局部编辑能力。同时推出的 Seedream 5.0 Pro 支持交互式图像编辑和多图层分离，Seed-Audio 1.0 可实现影视级音效一键生成。豆包 2.1 Pro 在编程和 Agent 评测中进入全球第一梯队，百万 token 输入仅 6 元。

豆包 2.1 Pro：编程与 Agent 能力达全球第一梯队

火山引擎在 2026 FORCE 原动力大会上发布豆包大模型 2.1 Pro。该模型在 Terminal Bench（终端编程）、SciCode（科研问题）和仓库级代码生成评测中均表现出色，与 Claude Opus 4.7 基本持平。在 Agent 能力上，MCP Atlas 评测全面超越 Opus 4.7，GDPval 真实经济价值评测获国内第一。价格方面，百万 token 输入 6 元、输出 30 元，缓存命中仅 1.2 元，提供半价的 turbo 版本。

Seedance 2.5：视频生成突破 15 秒瓶颈

继 2 月发布的 Seedance 2.0 实现原生 4K 后，Seedance 2.5 在内测尾声，预计 7 月初正式上线。三大升级：单条视频最长 30 秒（全球最长），优于同类模型的 15-20 秒；多参考能力支持 50 个全模态素材联合输入（全球最多）；支持局部编辑，可在保持整体画面不变的前提下修改背景、商品或模特。现场演示了 10 万面宇宙飞船白膜生成渲染视频、多语言产品说明书生成、具身智能训练数据合成等应用。

Seedream 5.0 Pro：交互式精准编辑与多图层分离

图像模型 Seedream 5.0 Pro 支持用户通过文字描述或直接在画面上标记（箭头、高亮块）实现精准编辑，例如移动物体位置、添加元素。多图层分离功能可圈选任意区域并输出为独立图层，被移除的背景可自动填充。该模型能生成高密度信息图（如复杂图表、PPT 页面的完整内容），并支持英语、西班牙语、阿拉伯语等 10 余种语言，自动适配排版习惯。与 Seedance 2.5 配合可生成 30 秒科普视频。

Seed-Audio 1.0：影视级音效一键生成

音频模型 Seed-Audio 1.0 支持情绪、口音、背景音、氛围音、拟音特效一次输出。在产业侧，奔驰和东风已基于豆包大模型探索智能座舱语音交互。

数据与战略

截至 2026 年 6 月，豆包大模型日均 token 调用量达 180 万亿，公有云大模型市场份额提升至 49.5%。字节跳动 CEO 梁汝波表示，收缩业务宽度、聚焦 AI 并提升模型能力是公司当前最重要的事。

阅读原文详情

豆包 2.1 Pro：编程与 Agent 能力达全球第一梯队

Seedance 2.5：视频生成突破 15 秒瓶颈

Seedream 5.0 Pro：交互式精准编辑与多图层分离

Seed-Audio 1.0：影视级音效一键生成

数据与战略

准备好启动您的定制项目了吗？