GPT-5.4上线首周创收10亿美元:单句成本高昂但推理效率飙升32倍

OpenAI总裁Greg披露,GPT-5.4上线仅一周即实现10亿美元年化净新增收入(ARR),日均处理量达5万亿token。该模型虽因高输出token消耗导致单次调用成本极高(如一句“Hi”耗资80美元),但在ARC-AGI-1基准测试中,其完成任务的成本较前代降低至0.37美元,效率提升32倍。作为首个融合推理、编程及原生电脑操作能力的“大一统”模型,GPT-5.4在多项关键任务中展现出超越人类的表现。

事件概述

OpenAI最新发布的 GPT-5.4 模型在上线首周取得了惊人的商业与性能表现。据 OpenAI 总裁 Greg 披露,该模型日均处理约 5 万亿 token,带来 10 亿美元的年化净新增收入(ARR)。其日均流量规模已超过 OpenAI 一年前整个 API 的总量,相当于每天处理超过 4500 本《红楼梦》的文本量。

核心数据与成本分析

尽管 GPT-5.4 带来了巨额收入,但其高昂的 Token 消耗和单价引发了关注:

  • 极端成本案例:知名博主 YuChen Jin 仅对 GPT-5.4 Pro 输入一句“Hi,俺是 Anthropic 创始人”,便消耗了 80 美元。
  • Token 消耗量:在 Artificial Analysis 的智能指数测试中,GPT-5.4 (xhigh) 花费了约 1.2 亿个 token,比 Gemini 3.1 Pro Preview(5700 万 token)高出约 2 倍,比 GPT-5.3 Codex (xhigh) 多约 55%。
  • 定价对比
    • GPT-5.4:输入 2.5 美元/百万 token,输出 15 美元/百万 token。
    • GPT-5.2 (xhigh):输入 1.75 美元/百万 token,输出 14 美元/百万 token。
    • Gemini 3.1 Pro Preview:输入 2 美元/百万 token,输出 12 美元/百万 token。
  • 总测试成本:跑完智能指数测试,GPT-5.4 成本约为 2951 美元,比 GPT-5.2 (xhigh) 高出约 28%,是 Gemini 3.1 Pro Preview(约 892 美元)的 3 倍以上。

效率跃升:从“烧钱”到“省钱”的转折

虽然单次调用的 Token 成本和绝对金额较高,但 GPT-5.4 在真实任务中的推理效率实现了指数级提升,使得完成特定任务的单位成本大幅下降:

  • ARC-AGI-1 基准测试
    • GPT-5.4 (High) 准确率达 90%,单项任务成本仅为 0.37 美元
    • 对比去年 12 月 GPT-5.2 Pro (xhigh) 的 90.5% 准确率(成本 11.64 美元),GPT-5.4 的效率提升了 32 倍
  • ARC-AGI-2 基准测试
    • GPT-5.4 得分 74.0%,每项任务成本为 1.52 美元。
    • GPT-5.4 Pro 得分 83.3%,成本为 16.41 美元。
    • GPT-5.2 Pro (High) 得分 54.2%,成本为 15.72 美元。

这意味着在达到相同或更高准确率的前提下,原本需数美元才能完成的任务,现在仅需几美分即可解决。

技术特性:首个“大一统”模型

GPT-5.4 被定义为 OpenAI 的首个“原生大一统”模型,具备以下核心能力:

  1. 全领域覆盖:融合了推理(Reasoning)、编程(Coding)、计算机原生交互(Computer Use)、深度网页搜索及百万级 Token 上下文。
  2. 人机对比优势:在 44 种不同工作岗位的评估中,GPT-5.4 有 83% 的概率胜过人类(包括律师、会计师、财务分析师等知识型岗位)。
  3. 原生电脑操作
    • 支持通过截图理解软件界面,并执行鼠标点击、键盘输入等操作。
    • 无需专用 API,仅基于坐标和屏幕截图即可完成复杂流程(如发邮件、安排日程、批量数据录入)。
    • 具备自我修正能力:例如在 Microsoft Paint 绘制 Logo 失败后,能自主打开浏览器搜索图片并导入重绘。

行业影响与展望

OpenAI 正加速推进 AI 基础设施与商业化布局,联合亚马逊、英伟达和软银拿下了 1100 亿美元的新融资。CEO Sam Altman 提出 AI 将像电力一样成为公共事业,并计划向市场大量投放 Token。随着 GPT-5.4 在垂直应用领域的全面超越,AI 正在重塑工作流与商业模式。

准备好启动您的定制项目了吗?

现在咨询,即可获得免费的业务梳理与技术架构建议方案。