阶跃星辰开源 Step 3.7 Flash:面向生产级 Agent,平衡速度、成本与可靠性

2026/05/29 10:41阅读量 4

阶跃星辰于 5 月 29 日发布并开源 Step 3.7 Flash 模型,专为生产级 Agent 场景设计。该模型采用稀疏 MoE 架构,总参数 196B、激活参数 11B,生成速度最高 400 Tokens/s,并在多工具协同、长程任务执行等基准测试中表现优异。

事件概述

5 月 29 日,基础大模型创业公司阶跃星辰(StepFun)发布并开源 Step 3.7 Flash 模型。该模型定位为「生产级 Agent 打造的 Flash 模型」,旨在平衡速度、成本、可靠执行与复杂任务处理能力。

核心信息

  • 架构与性能:采用稀疏 MoE 架构,总参数 196B + 1.8B(ViT),激活参数仅 11B,最高生成速度达 400 Tokens/s,适合高频、多轮 Agent 应用场景。

  • 关键能力优化:针对生产级 Agent 需求,原生支持多模态理解(UI、图表、文档等)、联网与视觉搜索增强、高可靠工具调用与编排,并与主流 Agent 框架(Claude Code、OpenClaw、Hermes Agent 等)兼容,支持云端和本地部署。

  • 基准测试成绩

    • 在 SimpleVQA(Search)、V*(Python)等复杂视觉任务上展现接近旗舰模型的水平。
    • Toolathlon(多工具协同)得分 49.5%,ClawEval-1.1(真实日常自主任务)得分 67.1%,GDPval(44 种职业)得分 45.8%。
    • τ²-bench Telecom 低、中、高推理难度下通过率均超 98%。

值得关注

  • 行业趋势:Flash 类模型正从轻量替代品转变为支撑生产级 Agent 规模化落地的基础设施。此前 Step 3.5 Flash 曾登顶 OpenRouter 平台 OpenClaw 调用量月榜全球第一。
  • 后续计划:阶跃表示将围绕 Step 3.7 Flash 推出生态共建计划与限时体验活动。

准备好启动您的定制项目了吗?

现在咨询,即可获得免费的业务梳理与技术架构建议方案。