OpenAI 发布 GPT-5.6 系列:Sol 能力登顶,但安全审查限制了发布节奏
2026/06/27 15:30阅读量 2
OpenAI 发布 GPT-5.6 系列模型,包含旗舰版 Sol、平衡版 Terra 和低成本版 Luna。Sol 在编程、生物信息学和网络安全基准测试中创下新高,但 OpenAI 因安全考量采取了“有限预览”模式,首批仅面向约 20 家美国合作伙伴开放。美国政府参与了访问权限审核,OpenAI 对此表示接受但认为不应成为常态。
事件概述
OpenAI 于近期发布 GPT-5.6 系列,包含三款模型:
- Sol(太阳):旗舰模型,自称当前最强,面向高难度复杂任务。
- Terra(大地):平衡型模型,性能接近 GPT-5.5,价格减半。
- Luna(月亮):主打速度和低成本。
该系列通过数字(代际)与名称(能力层级)重新梳理了产品线。
核心能力表现
Sol 在以下领域表现突出:
- 编程:Terminal-Bench 2.1 得分 88.8%(Ultra 模式 91.9%),超越 GPT-5.5(88.0%)及竞品 Claude Mythos 5(84.3%)、Gemini 3.1 Pro Preview(70.7%)。Ultra 模式下模型调用多个子 Agent 拆分复杂任务。
- 生物信息学:GeneBench v1 上以更少 tokens 超越 GPT-5.5。
- 网络安全:ExploitBench 上接近 Mythos Preview 但只消耗约 1/3 的输出 tokens。OpenAI 同时强调 Sol 尚未跨越 Preparedness Framework 中的关键风险阈值,无法稳定完成端到端攻击。
安全与发布限制
OpenAI 为 GPT-5.6 配置了分层安全栈(模型拒答、实时分类器、账号审查等),并在自动化红队测试中投入超 70 万 A100 等效 GPU 小时。
模型以“有限预览”方式发布:
- 首批仅面向约 20 家经美国政府批准的合作企业(含可能的亚马逊 Bedrock 平台入口)。
- OpenAI 在发布前已向美国政府展示模型能力,并按要求限制访问。
- OpenAI 表示不赞同政府长期介入模型访问流程,但认为当前是为争取更广泛开放而采取的短期安排。
价格与可用性
- Sol:输入 $5/百万 tokens,输出 $30/百万 tokens
- Terra:输入 $2.5,输出 $15
- Luna:输入 $1,输出 $6
- 支持 prompt caching(显式 breakpoints,缓存生命周期 ≥30 分钟),缓存读取享 90% 折扣。
- GPT-5.6 Sol 预计 7 月登陆 Cerebras,最高 750 tokens/秒。
行业趋势
前沿 AI 模型发布正被纳入国家安全框架。Anthropic 此前因美国政府要求停用 Fable 5,OpenAI 此次接受类似审查,预示着模型能力逼近门槛后,使用资格与安全审核将成为比性能更关键的议题。
