Seedance 2.5 正式发布,支持 30 秒视频生成与 50 路多参考输入
火山引擎在 2026 FORCE 大会上发布豆包大模型 2.1 Pro 及多项 AI 模型。Seedance 2.5 实现单条视频最长 30 秒、支持 50 个全模态素材联合输入,并具备局部编辑能力。同时推出的 Seedream 5.0 Pro 支持交互式图像编辑和多图层分离,Seed-Audio 1.0 可实现影视级音效一键生成。豆包 2.1 Pro 在编程和 Agent 评测中进入全球第一梯队,百万 token 输入仅 6 元。
豆包 2.1 Pro:编程与 Agent 能力达全球第一梯队
火山引擎在 2026 FORCE 原动力大会上发布豆包大模型 2.1 Pro。该模型在 Terminal Bench(终端编程)、SciCode(科研问题)和仓库级代码生成评测中均表现出色,与 Claude Opus 4.7 基本持平。在 Agent 能力上,MCP Atlas 评测全面超越 Opus 4.7,GDPval 真实经济价值评测获国内第一。价格方面,百万 token 输入 6 元、输出 30 元,缓存命中仅 1.2 元,提供半价的 turbo 版本。
Seedance 2.5:视频生成突破 15 秒瓶颈
继 2 月发布的 Seedance 2.0 实现原生 4K 后,Seedance 2.5 在内测尾声,预计 7 月初正式上线。三大升级:单条视频最长 30 秒(全球最长),优于同类模型的 15-20 秒;多参考能力支持 50 个全模态素材联合输入(全球最多);支持局部编辑,可在保持整体画面不变的前提下修改背景、商品或模特。现场演示了 10 万面宇宙飞船白膜生成渲染视频、多语言产品说明书生成、具身智能训练数据合成等应用。
Seedream 5.0 Pro:交互式精准编辑与多图层分离
图像模型 Seedream 5.0 Pro 支持用户通过文字描述或直接在画面上标记(箭头、高亮块)实现精准编辑,例如移动物体位置、添加元素。多图层分离功能可圈选任意区域并输出为独立图层,被移除的背景可自动填充。该模型能生成高密度信息图(如复杂图表、PPT 页面的完整内容),并支持英语、西班牙语、阿拉伯语等 10 余种语言,自动适配排版习惯。与 Seedance 2.5 配合可生成 30 秒科普视频。
Seed-Audio 1.0:影视级音效一键生成
音频模型 Seed-Audio 1.0 支持情绪、口音、背景音、氛围音、拟音特效一次输出。在产业侧,奔驰和东风已基于豆包大模型探索智能座舱语音交互。
数据与战略
截至 2026 年 6 月,豆包大模型日均 token 调用量达 180 万亿,公有云大模型市场份额提升至 49.5%。字节跳动 CEO 梁汝波表示,收缩业务宽度、聚焦 AI 并提升模型能力是公司当前最重要的事。
