OpenAI 推出 GPT-5.4 mini 与 nano:小模型重塑 AI 成本结构,旗舰版调度策略成主流

OpenAI 正式发布 GPT-5.4 mini 和 nano 两款小型模型,旨在解决复杂任务中调用旗舰模型成本过高的问题。nano 输入输出价格分别仅为旗舰版的 8% 和约 8%,配合高响应速度,成为高频轻量任务的首选。测试数据显示,mini 在代码生成与电脑操作任务上逼近旗舰版性能,确立了“大模型决策、小模型执行”的协同架构趋势。

事件概述

针对 AI Agent(智能体)框架爆发导致的单次任务需多次调用大模型、成本激增的问题,OpenAI 正式推出 GPT-5.4 miniGPT-5.4 nano 两款小型模型。官方宣称这是公司“迄今最强大的小型模型”,旨在通过“薄利多销”策略,将 AI 基础设施成本大幅降低,推动轻量化模型成为行业落地的主流选择。

核心信息:定价与参数

两款新模型均支持 400k tokens 上下文窗口,但在成本上实现了显著下降:

  • 输入成本
    • GPT-5.4 旗舰版:2.5 美元/百万 token
    • GPT-5.4 mini:0.75 美元/百万 token(约为旗舰版的 30%)
    • GPT-5.4 nano:0.2 美元/百万 token(约为旗舰版的 8%)
  • 输出成本
    • GPT-5.4 旗舰版:15 美元/百万 token
    • GPT-5.4 mini:约 4.5 美元/百万 token(约为旗舰版的 1/3)
    • GPT-5.4 nano:约 1.25 美元/百万 token(约为旗舰版的 1/12)

能力表现与测试数据

尽管定位为轻量级,两款模型在关键基准测试中展现了接近旗舰版的性能:

  1. 代码编程能力 (SWE-bench Pro)
    • GPT-5.4 mini:准确率达 54.4%,逼近旗舰版的 57.7%。
    • GPT-5.4 nano:准确率达 52.4%,适合快速迭代的代码审查及辅助子 Agent 任务。
  2. 真实环境操作 (OSWorld-Verified)
    • 该测试模拟 AI 像人一样操作电脑(使用 Chrome、Office 等软件)。
    • GPT-5.4 mini:准确率达 72.1%,几乎追平旗舰版的 75%,显示出极高的 UI 识别与操作精度。
    • GPT-5.4 nano:准确率为 39.0%,低于上一代 GPT-5 mini 的 42.0%,表明其在复杂精细操控任务上仍有局限。

行业趋势与战略意义

  • 市场转向:根据 OpenRouter 榜单,本月度最受欢迎的前十大 LLM 中,轻量化模型占据 6 席。Top 2 分别为 MiniMax M2.5(月度涨幅 476%)和 Google Gemini 3 Flash Preview,其调用量远超通用旗舰模型。Hugging Face Hub 下载统计显示,92.48% 的下载量来自少于 10 亿参数的模型。
  • 商业逻辑:OpenAI 全球周活用户已突破 9 亿,但付费转化率仅约 5%。绝大多数 C 端用户场景(如日常对话、文案润色、轻量代码)无需旗舰模型的极限推理能力。通过提供低成本、毫秒级响应的小模型,OpenAI 意在覆盖更广泛的免费转付费场景,提升总收入。
  • 架构变革:未来的主流模式将是“混合调度”。由 GPT-5.4 旗舰版负责理解意图、拆解步骤和顶层战略;由 mini/nano 模型作为子 Agent 批量执行具体代码修改、测试运行或界面操作。这种架构既保留了大模型的逻辑上限,又解决了小任务的高成本痛点。

结论

GPT-5.4 mini 和 nano 的发布标志着 AI 应用从“单一模型通吃”向“大小模型协同”转变。虽然 nano 在复杂操作任务上尚不及旗舰版,但其极低的成本使其成为高频、低复杂度任务的理想选择。对于开发者和企业而言,利用小模型替代部分旗舰模型调用,将成为降低 AI 运营成本的关键路径。

准备好启动您的定制项目了吗?

现在咨询,即可获得免费的业务梳理与技术架构建议方案。