艾伦AI研究:大模型碳排放核算严重低估,后训练成新碳排大头
2026/05/08 22:53阅读量 9
美国艾伦AI研究所(Ai2)研究揭示,传统仅关注预训练最终运行的大模型碳核算方法已严重低估真实碳排放。以Olmo 3模型为例,最终运行碳排放仅占总训练碳足迹的18%,早期探索和后训练(尤其是强化学习)环节才是碳排主体。随着推理模型和后训练能耗剧增,训练与推理边界模糊,行业需全面披露训练全流程碳排放。
事件概述
艾伦AI研究所(Ai2)发布论文指出,当前大模型碳排放核算方法严重落后于训练范式变化。传统核算只统计预训练阶段的“最终训练运行”,但实际中,耗能巨大的早期探索开发、后训练(强化学习等)环节已成为碳排放主体,且训练与推理的边界日益模糊。
核心数据
- Olmo 3模型家族:基于H100集群训练,总GPU时834万,其中最终运行仅占18%。
- 碳排放:最终运行647吨CO₂当量,早期探索开发2757吨,数据合成675吨,硬件制造隐含排放172吨,总计4251吨。后训练能耗约为传统指令模型的17倍,主要来自强化学习的“生成轨迹”环节。
- 水资源消耗:完整训练过程耗水15887吨,约等于一个美国人140年用水量。
- EpochAI估算:OpenAI等公司最终训练运行成本仅占总研发支出的10%左右(OpenAI为9.6%)。
行业呼吁与对比
论文呼吁行业披露后训练成本和早期探索的“乘数”,而不仅是预训练和最终运行。与中国相比,美国部分科技企业已减弱碳中和承诺,而中国模型厂商竞争激烈、能效较低、绿电分布不均,但碳中和目标明确,更需认真核算AI碳足迹。
