阶跃星辰开源 Step 3.7 Flash:面向生产级 Agent,平衡速度、成本与可靠性
2026/05/29 10:41阅读量 4
阶跃星辰于 5 月 29 日发布并开源 Step 3.7 Flash 模型,专为生产级 Agent 场景设计。该模型采用稀疏 MoE 架构,总参数 196B、激活参数 11B,生成速度最高 400 Tokens/s,并在多工具协同、长程任务执行等基准测试中表现优异。
事件概述
5 月 29 日,基础大模型创业公司阶跃星辰(StepFun)发布并开源 Step 3.7 Flash 模型。该模型定位为「生产级 Agent 打造的 Flash 模型」,旨在平衡速度、成本、可靠执行与复杂任务处理能力。
核心信息
-
架构与性能:采用稀疏 MoE 架构,总参数 196B + 1.8B(ViT),激活参数仅 11B,最高生成速度达 400 Tokens/s,适合高频、多轮 Agent 应用场景。
-
关键能力优化:针对生产级 Agent 需求,原生支持多模态理解(UI、图表、文档等)、联网与视觉搜索增强、高可靠工具调用与编排,并与主流 Agent 框架(Claude Code、OpenClaw、Hermes Agent 等)兼容,支持云端和本地部署。
-
基准测试成绩:
- 在 SimpleVQA(Search)、V*(Python)等复杂视觉任务上展现接近旗舰模型的水平。
- Toolathlon(多工具协同)得分 49.5%,ClawEval-1.1(真实日常自主任务)得分 67.1%,GDPval(44 种职业)得分 45.8%。
- τ²-bench Telecom 低、中、高推理难度下通过率均超 98%。
值得关注
- 行业趋势:Flash 类模型正从轻量替代品转变为支撑生产级 Agent 规模化落地的基础设施。此前 Step 3.5 Flash 曾登顶 OpenRouter 平台 OpenClaw 调用量月榜全球第一。
- 后续计划:阶跃表示将围绕 Step 3.7 Flash 推出生态共建计划与限时体验活动。
