Google 发布 Gemma 4:四版本覆盖本地与移动端,Apache 2.0 授权更灵活
2026/04/03 14:25阅读量 5
Google 正式发布开放权重模型 Gemma 4,包含四个针对不同硬件场景优化的版本。大参数版本支持在高端 GPU 或量化后消费级显卡运行,小参数版本专为移动设备优化。该系列采用 Apache 2.0 协议,显著提升了商业使用的灵活性。
事件概述
Google 于 2026 年 4 月 3 日发布最新一代开放权重模型 Gemma 4。作为继一年前发布的 Gemma 3 之后的迭代产品,Gemma 4 旨在通过多版本策略覆盖从云端高性能计算到终端设备的广泛场景。
核心信息
- 版本架构:Gemma 4 共提供四个版本,分为两类:
- 高性能版:包含 26B Mixture of Experts (MoE) 和 31B Dense 两个大参数模型。设计目标是在配备 80GB Nvidia H100 GPU(约 20 万人民币)的服务器上以 bfloat16 格式未量化运行;若进行量化处理降低精度,亦可适配消费级 GPU。
- 轻量版:包含 Effective 2B (E2B) 和 Effective 4B (E4B) 两个小参数模型。专为移动设备及边缘计算设备设计,旨在实现本地高效推理。
- 端侧优化:Google Pixel 团队与高通、联发科紧密合作,针对智能手机、Raspberry Pi 及 Jetson Nano 等设备对小模型进行了专项优化。
- 授权协议:Gemma 4 采用 Apache 2.0 开源协议。相较于以往版本,新协议在商业用途上的限制更为宽松,降低了企业部署门槛。
