QVGen 实现视频模型 4bit 无损量化,推理显存降低 75%

2026/02/25 18:07阅读量 2

一种专为视频扩散模型设计的量化训练方案,能把模型压到 4bit 且画质接近原模型。 解决了视频模型低比特量化后训练不稳定、画质崩塌及显存占用过高的痛点。 训练期引入辅助模块稳梯度,推理前自动移除该模块,实现训练稳、推理轻、无额外开销。

暂无可展示正文

准备好启动您的定制项目了吗?

现在咨询,即可获得免费的业务梳理与技术架构建议方案。