Google 发布 Gemma 4:四版本覆盖本地与移动端,Apache 2.0 授权更灵活

2026/04/03 14:25阅读量 5

Google 正式发布开放权重模型 Gemma 4,包含四个针对不同硬件场景优化的版本。大参数版本支持在高端 GPU 或量化后消费级显卡运行,小参数版本专为移动设备优化。该系列采用 Apache 2.0 协议,显著提升了商业使用的灵活性。

事件概述

Google 于 2026 年 4 月 3 日发布最新一代开放权重模型 Gemma 4。作为继一年前发布的 Gemma 3 之后的迭代产品,Gemma 4 旨在通过多版本策略覆盖从云端高性能计算到终端设备的广泛场景。

核心信息

  • 版本架构:Gemma 4 共提供四个版本,分为两类:
    • 高性能版:包含 26B Mixture of Experts (MoE) 和 31B Dense 两个大参数模型。设计目标是在配备 80GB Nvidia H100 GPU(约 20 万人民币)的服务器上以 bfloat16 格式未量化运行;若进行量化处理降低精度,亦可适配消费级 GPU。
    • 轻量版:包含 Effective 2B (E2B) 和 Effective 4B (E4B) 两个小参数模型。专为移动设备及边缘计算设备设计,旨在实现本地高效推理。
  • 端侧优化:Google Pixel 团队与高通、联发科紧密合作,针对智能手机、Raspberry Pi 及 Jetson Nano 等设备对小模型进行了专项优化。
  • 授权协议:Gemma 4 采用 Apache 2.0 开源协议。相较于以往版本,新协议在商业用途上的限制更为宽松,降低了企业部署门槛。

官方资源

准备好启动您的定制项目了吗?

现在咨询,即可获得免费的业务梳理与技术架构建议方案。