GPT-5.4上线首周创收10亿美元：单句成本高昂但推理效率飙升32倍

2026/03/17 14:07阅读量 36

OpenAI总裁Greg披露，GPT-5.4上线仅一周即实现10亿美元年化净新增收入（ARR），日均处理量达5万亿token。该模型虽因高输出token消耗导致单次调用成本极高（如一句“Hi”耗资80美元），但在ARC-AGI-1基准测试中，其完成任务的成本较前代降低至0.37美元，效率提升32倍。作为首个融合推理、编程及原生电脑操作能力的“大一统”模型，GPT-5.4在多项关键任务中展现出超越人类的表现。

事件概述

OpenAI最新发布的 GPT-5.4 模型在上线首周取得了惊人的商业与性能表现。据 OpenAI 总裁 Greg 披露，该模型日均处理约 5 万亿 token，带来 10 亿美元的年化净新增收入（ARR）。其日均流量规模已超过 OpenAI 一年前整个 API 的总量，相当于每天处理超过 4500 本《红楼梦》的文本量。

核心数据与成本分析

尽管 GPT-5.4 带来了巨额收入，但其高昂的 Token 消耗和单价引发了关注：

极端成本案例：知名博主 YuChen Jin 仅对 GPT-5.4 Pro 输入一句“Hi，俺是 Anthropic 创始人”，便消耗了 80 美元。
Token 消耗量：在 Artificial Analysis 的智能指数测试中，GPT-5.4 (xhigh) 花费了约 1.2 亿个 token，比 Gemini 3.1 Pro Preview（5700 万 token）高出约 2 倍，比 GPT-5.3 Codex (xhigh) 多约 55%。
定价对比：
- GPT-5.4：输入 2.5 美元/百万 token，输出 15 美元/百万 token。
- GPT-5.2 (xhigh)：输入 1.75 美元/百万 token，输出 14 美元/百万 token。
- Gemini 3.1 Pro Preview：输入 2 美元/百万 token，输出 12 美元/百万 token。
总测试成本：跑完智能指数测试，GPT-5.4 成本约为 2951 美元，比 GPT-5.2 (xhigh) 高出约 28%，是 Gemini 3.1 Pro Preview（约 892 美元）的 3 倍以上。

效率跃升：从“烧钱”到“省钱”的转折

虽然单次调用的 Token 成本和绝对金额较高，但 GPT-5.4 在真实任务中的推理效率实现了指数级提升，使得完成特定任务的单位成本大幅下降：

ARC-AGI-1 基准测试：
- GPT-5.4 (High) 准确率达 90%，单项任务成本仅为 0.37 美元。
- 对比去年 12 月 GPT-5.2 Pro (xhigh) 的 90.5% 准确率（成本 11.64 美元），GPT-5.4 的效率提升了 32 倍。
ARC-AGI-2 基准测试：
- GPT-5.4 得分 74.0%，每项任务成本为 1.52 美元。
- GPT-5.4 Pro 得分 83.3%，成本为 16.41 美元。
- GPT-5.2 Pro (High) 得分 54.2%，成本为 15.72 美元。

这意味着在达到相同或更高准确率的前提下，原本需数美元才能完成的任务，现在仅需几美分即可解决。

技术特性：首个“大一统”模型

GPT-5.4 被定义为 OpenAI 的首个“原生大一统”模型，具备以下核心能力：

全领域覆盖：融合了推理（Reasoning）、编程（Coding）、计算机原生交互（Computer Use）、深度网页搜索及百万级 Token 上下文。
人机对比优势：在 44 种不同工作岗位的评估中，GPT-5.4 有 83% 的概率胜过人类（包括律师、会计师、财务分析师等知识型岗位）。
原生电脑操作：
- 支持通过截图理解软件界面，并执行鼠标点击、键盘输入等操作。
- 无需专用 API，仅基于坐标和屏幕截图即可完成复杂流程（如发邮件、安排日程、批量数据录入）。
- 具备自我修正能力：例如在 Microsoft Paint 绘制 Logo 失败后，能自主打开浏览器搜索图片并导入重绘。

行业影响与展望

OpenAI 正加速推进 AI 基础设施与商业化布局，联合亚马逊、英伟达和软银拿下了 1100 亿美元的新融资。CEO Sam Altman 提出 AI 将像电力一样成为公共事业，并计划向市场大量投放 Token。随着 GPT-5.4 在垂直应用领域的全面超越，AI 正在重塑工作流与商业模式。

阅读原文详情

事件概述

核心数据与成本分析

效率跃升：从“烧钱”到“省钱”的转折

技术特性：首个“大一统”模型

行业影响与展望

准备好启动您的定制项目了吗？