面壁智能与清华联合开源1.58-bit端侧大模型BitCPM-CANN

2026/05/26 11:20阅读量 2

面壁智能与清华大学合作开源了一款名为BitCPM-CANN的1.58-bit超低比特量化端侧大模型,旨在探索极低精度下的大模型推理效率与边缘部署可行性。

事件概述

面壁智能联合清华大学开源了BitCPM-CANN模型,这是一款采用1.58-bit量化技术的端侧大模型。1.58-bit量化是目前已知比特数极低的方案,能显著降低模型存储和计算开销,使其更适配手机、IoT等资源受限设备。

核心信息

  • 模型名称:BitCPM-CANN
  • 技术特点:使用1.58-bit(即每个权重仅需约2个比特)量化,属于极低精度推理的探索方向。
  • 开源方:面壁智能与清华大学
  • 应用场景:端侧(移动设备、边缘终端)部署,降低对云端算力的依赖。

值得关注

极低比特量化(如1.58-bit)在保持模型性能的同时大幅压缩体积,是实现大模型在端侧实时推理的关键路径之一。该模型的开源有助于推动低功耗、低延迟的本地AI应用发展。

准备好启动您的定制项目了吗?

现在咨询,即可获得免费的业务梳理与技术架构建议方案。