字节跳动发布豆包2.1系列模型,Agent连续运行18小时完成芯片设计代码
2026/06/23 21:37阅读量 2
字节跳动发布Seed 2.1系列模型,包含Pro和Turbo两个版本,API已全量上线火山方舟。Pro版本在芯片设计RTL代码生成中连续运行近18小时,完成1303行代码;在Terminal Bench、SciCode等评测中比肩甚至超越Claude Opus 4.7和GPT-5.5,价格仅为1/4。实测显示其在3D房屋生成、PPT制作、数据分析、截图转PRD等任务中达到“生产级可用”水平。
事件概述
字节跳动发布Seed 2.1系列模型(Doubao-Seed-2.1-Pro、Doubao-Seed-2.1-Turbo),API服务已全量上线火山方舟。Pro版本在芯片设计RTL环节连续运行近18小时,经历9轮迭代,完成6个核心模块、1303行RTL代码,而该工作传统需3-5名人类工程师数周完成。
核心信息
- 性能表现:在Terminal Bench 2.1上基本持平Claude Opus 4.7;在SciCode科学计算代码评测上超过Opus 4.7和GPT-5.5;在MCP-Atlas工具调用评测中同样超越两者;在Agents’ Last Exam(ALE)基准中处于参评模型第一梯队。
- 价格优势:Seed 2.1 Pro能力与国外头部AI比肩,但价格仅为其1/4(以Opus 4.6-4.8为参照)。每百万Token输入6元、输出30元,缓存命中仅1.2元。
- 实测用例:
- 3D房屋生成:在OpenCode中调用API,通过多轮迭代完成带坡屋顶、窗户、车库、庭院灯元素的WebGL2房屋,支持交互导航。
- 自动生成PPT:根据需求生成10页《AI Agent进入企业生产系统的三个信号》汇报PPT,内容完整且设计感强,并输出SVG逻辑图。
- 数据分析:基于模拟数据完成趋势判断、异常识别、转化率计算,输出带排版的Word报告和整理好的Excel。
- 截图变PRD:在豆包办公任务模式下,上传产品截图后自动识别功能区、分析问题并生成产品改版PRD草稿。
- 生态整合:Seed 2.1 Pro已同步接入TRAE、TRAE WORK、扣子等字节系产品,覆盖开发者工具、办公助手和Agent搭建平台。豆包日均Token使用量突破180万亿。
值得关注
- 字节跳动同时宣布视频生成模型Seedance升级至2.5版本,支持单次直出30秒视频,在长视频连贯性和画质上显著提升,预计7月初正式上线。
- Seed 2.1 Pro定位“生产级可用”,目标是从单纯聊天能力竞争转向任务完成率竞争,当前可作为第一生产力助手完成70%粗活,人工负责最后30%的判断与校验。
- 模型API入口:[火山方舟Seed 2.1 Pro](https://console.volcengine.com/ark/region:ark+cn-beijing/model/detail?Id=doubao-seed-2-1-pro%29 / [Turbo](https://console.volcengine.com/ark/region:ark+cn-beijing/model/detail?Id=doubao-seed-2-1-turbo%29
