阶跃星辰全面开源 Step 3.5 Flash
中国大模型创业公司阶跃星辰宣布全面开源其 Agent 基座模型 Step 3.5 Flash,包括预训练权重(Base)、中训练权重(Midtrain)及配套的 Steptron 训练框架。该模型采用稀疏 MoE 架构,总参数达 1960 亿,但推理时仅激活约 110 亿参数,在单请求代码任务下推理速度最高可达 350 TPS。此次开源标志着阶跃星辰在推动大模型技术普惠化方面迈出了重要一步。
36氪获悉,中国大模型创业公司阶跃星辰继开源 Step 3.5 Flash 模型后,又开源了这款 Agent 基座模型的预训练权重(Base)、中训练权重(Midtrain)以及配套的 Steptron 训练框架。 据了解,Step 3.5 Flash 采用稀疏 MoE 架构,总参数 1960 亿,但推理时仅激活约 110 亿参数,单请求代码任务下推理速度最高可达 350TPS。
