大模型竞争转向Agent场景:阶跃星辰推出高速模型,Flash类模型或成Agent基础设施

2026/06/04 11:03阅读量 2

大模型竞争正从单纯比拼智能转向Agent场景中的任务完成效率。阶跃星辰发布Step 3.7 Flash模型,输出速度达409 tokens/s,针对Agent工作流优化。Anthropic同样押注Agent方向,估值逼近9650亿美元。行业趋势显示,Flash类低成本、低延迟模型正成为Agent规模化落地的关键基础设施。

事件概述

大模型行业竞争重心正从单纯的模型智能比拼转向Agent场景中的实际任务执行效率。阶跃星辰近日发布并开源Step 3.7 Flash模型,主打面向真实Agent工作流,针对高频、多轮Agent应用场景进行优化,提升原生多模态理解、联网搜索、工具调用等关键能力。

核心信息

  • 模型性能:据Artificial Analysis Output Speed榜单,Step 3.7 Flash输出速度达409 tokens/s,在主流模型中位居第一;端到端响应时长、智能效率、速度价格比等指标也处于领先位置。该模型发布后两天即进入OpenRouter全球热榜前列。
  • 行业背景:以Anthropic为代表,顶级大模型厂商迅速将发力方向转向打造Agent能力。Anthropic在5月末完成H轮650亿美元融资,投后估值9650亿美元,压过OpenAI,并传出优先IPO消息。
  • 趋势变化:单点性能指标重要性下降,优化整个Agent loop(延迟、成本、任务完成率)成为关键。Flash类模型此前被视为轻量级替代品,但在Agent大幅推涨Token消耗量的背景下,其低延迟、低成本、高吞吐的优势使其有望成为支撑生产级Agent规模化落地的基础设施。

值得关注

  • 多模态能力跃迁:阶跃星辰是国产大模型中少有的坚持“原生多模”方向的厂商,超八成模型为多模态。多模态被视为Agent接入真实世界任务的关键接口,其提升将加速Agent落地和端侧AI爆发。
  • 终端Agent布局:阶跃与国内多家手机厂商合作,同时覆盖汽车、IoT及具身智能等端侧场景。有端侧芯片从业者预测,未来超80%大模型推理将在终端完成,但当前端侧能力在多模态实时交互方面仍待提升。
  • 商业化节奏:阶跃星辰在年初完成50亿人民币B+轮融资,近期传出新一轮25亿美金融资接近完成,赴港上市节奏加快。Step 3.7 Flash被视为其集中“亮牌”的关键产品之一。

准备好启动您的定制项目了吗?

现在咨询,即可获得免费的业务梳理与技术架构建议方案。