智谱GLM-5.1高速版发布,推理速度达400 tokens/s

2026/05/22 11:12阅读量 4

智谱推出GLM-5.1高速版,推理速度达到每秒400 tokens,显著提升模型响应效率。

事件概述

智谱正式推出GLM-5.1高速版,其推理速度达到400 tokens/s,较此前版本实现大幅提升。该版本专注于加速生成过程,可有效缩短响应延迟。

准备好启动您的定制项目了吗?

现在咨询,即可获得免费的业务梳理与技术架构建议方案。