智谱GLM-5.1高速版发布,推理速度达400 tokens/s2026/05/22 11:12阅读量 4智谱推出GLM-5.1高速版,推理速度达到每秒400 tokens,显著提升模型响应效率。事件概述 智谱正式推出GLM-5.1高速版,其推理速度达到400 tokens/s,较此前版本实现大幅提升。该版本专注于加速生成过程,可有效缩短响应延迟。阅读原文详情