阶跃星辰全面开源 Step 3.5 Flash

中国大模型创业公司阶跃星辰宣布全面开源其 Agent 基座模型 Step 3.5 Flash,包括预训练权重(Base)、中训练权重(Midtrain)及配套的 Steptron 训练框架。该模型采用稀疏 MoE 架构,总参数达 1960 亿,但推理时仅激活约 110 亿参数,在单请求代码任务下推理速度最高可达 350 TPS。此次开源标志着阶跃星辰在推动大模型技术普惠化方面迈出了重要一步。

36氪获悉,中国大模型创业公司阶跃星辰继开源 Step 3.5 Flash 模型后,又开源了这款 Agent 基座模型的预训练权重(Base)、中训练权重(Midtrain)以及配套的 Steptron 训练框架。 据了解,Step 3.5 Flash 采用稀疏 MoE 架构,总参数 1960 亿,但推理时仅激活约 110 亿参数,单请求代码任务下推理速度最高可达 350TPS。

准备好启动您的定制项目了吗?

现在咨询,即可获得免费的业务梳理与技术架构建议方案。