OpenAI 推出 GPT-5.4 mini 与 nano：小模型重塑 AI 成本结构，旗舰版调度策略成主流

2026/03/19 18:02阅读量 30

OpenAI 正式发布 GPT-5.4 mini 和 nano 两款小型模型，旨在解决复杂任务中调用旗舰模型成本过高的问题。nano 输入输出价格分别仅为旗舰版的 8% 和约 8%，配合高响应速度，成为高频轻量任务的首选。测试数据显示，mini 在代码生成与电脑操作任务上逼近旗舰版性能，确立了“大模型决策、小模型执行”的协同架构趋势。

事件概述

针对 AI Agent（智能体）框架爆发导致的单次任务需多次调用大模型、成本激增的问题，OpenAI 正式推出 GPT-5.4 mini 和 GPT-5.4 nano 两款小型模型。官方宣称这是公司“迄今最强大的小型模型”，旨在通过“薄利多销”策略，将 AI 基础设施成本大幅降低，推动轻量化模型成为行业落地的主流选择。

核心信息：定价与参数

两款新模型均支持 400k tokens 上下文窗口，但在成本上实现了显著下降：

输入成本：
- GPT-5.4 旗舰版：2.5 美元/百万 token
- GPT-5.4 mini：0.75 美元/百万 token（约为旗舰版的 30%）
- GPT-5.4 nano：0.2 美元/百万 token（约为旗舰版的 8%）
输出成本：
- GPT-5.4 旗舰版：15 美元/百万 token
- GPT-5.4 mini：约 4.5 美元/百万 token（约为旗舰版的 1/3）
- GPT-5.4 nano：约 1.25 美元/百万 token（约为旗舰版的 1/12）

能力表现与测试数据

尽管定位为轻量级，两款模型在关键基准测试中展现了接近旗舰版的性能：

代码编程能力 (SWE-bench Pro)：
- GPT-5.4 mini：准确率达 54.4%，逼近旗舰版的 57.7%。
- GPT-5.4 nano：准确率达 52.4%，适合快速迭代的代码审查及辅助子 Agent 任务。
真实环境操作 (OSWorld-Verified)：
- 该测试模拟 AI 像人一样操作电脑（使用 Chrome、Office 等软件）。
- GPT-5.4 mini：准确率达 72.1%，几乎追平旗舰版的 75%，显示出极高的 UI 识别与操作精度。
- GPT-5.4 nano：准确率为 39.0%，低于上一代 GPT-5 mini 的 42.0%，表明其在复杂精细操控任务上仍有局限。

行业趋势与战略意义

市场转向：根据 OpenRouter 榜单，本月度最受欢迎的前十大 LLM 中，轻量化模型占据 6 席。Top 2 分别为 MiniMax M2.5（月度涨幅 476%）和 Google Gemini 3 Flash Preview，其调用量远超通用旗舰模型。Hugging Face Hub 下载统计显示，92.48% 的下载量来自少于 10 亿参数的模型。
商业逻辑：OpenAI 全球周活用户已突破 9 亿，但付费转化率仅约 5%。绝大多数 C 端用户场景（如日常对话、文案润色、轻量代码）无需旗舰模型的极限推理能力。通过提供低成本、毫秒级响应的小模型，OpenAI 意在覆盖更广泛的免费转付费场景，提升总收入。
架构变革：未来的主流模式将是“混合调度”。由 GPT-5.4 旗舰版负责理解意图、拆解步骤和顶层战略；由 mini/nano 模型作为子 Agent 批量执行具体代码修改、测试运行或界面操作。这种架构既保留了大模型的逻辑上限，又解决了小任务的高成本痛点。

结论

GPT-5.4 mini 和 nano 的发布标志着 AI 应用从“单一模型通吃”向“大小模型协同”转变。虽然 nano 在复杂操作任务上尚不及旗舰版，但其极低的成本使其成为高频、低复杂度任务的理想选择。对于开发者和企业而言，利用小模型替代部分旗舰模型调用，将成为降低 AI 运营成本的关键路径。

阅读原文详情

事件概述

核心信息：定价与参数

能力表现与测试数据

行业趋势与战略意义

结论

准备好启动您的定制项目了吗？