QVGen 实现视频模型 4bit 无损量化,推理显存降低 75%2026/02/25 18:07阅读量 2一种专为视频扩散模型设计的量化训练方案,能把模型压到 4bit 且画质接近原模型。 解决了视频模型低比特量化后训练不稳定、画质崩塌及显存占用过高的痛点。 训练期引入辅助模块稳梯度,推理前自动移除该模块,实现训练稳、推理轻、无额外开销。暂无可展示正文阅读原文详情