GPT-5.6正式发布:最强模型却因安全管控受限发布
2026/06/27 07:09阅读量 10
OpenAI推出GPT-5.6系列模型(Sol/Terra/Luna),在编程、生物信息、网络安全等基准测试中创下新高,但受美国国家安全框架影响,仅向约20家经政府批准的合作伙伴有限预览。安全分级体系和政府审核成为此次发布的核心焦点。
事件概述
OpenAI于2026年6月27日正式发布GPT-5.6系列模型,包含三款型号:旗舰模型Sol(太阳)、日常平衡型Terra(大地)和低成本高速型Luna(月亮)。新模型采用有限预览方式发布,安全管控和政府审核成为核心影响因素。
核心信息
- 产品分层与价格:按百万tokens计费,Sol输入5美元/输出30美元,Terra输入2.5美元/输出15美元,Luna输入1美元/输出6美元。新增可预测的prompt缓存机制,提供至少30分钟缓存周期,缓存写入按1.25倍计费,读取享90%折扣。Sol将于7月登陆Cerebras平台。
- 能力表现:
- 编程:Sol Ultra在Terminal-Bench 2.1命令行工作流测试中得分91.9%,Sol得分88.8%,高于GPT-5.5的88.0%。Ultra模式通过多子Agent拆分复杂任务提升效率。
- 生物信息学:在GeneBench v1评测中,Sol以更少输出tokens取得优于GPT-5.5的结果,提升科研场景成本效率。
- 网络安全:在ExploitBench上,Sol表现接近竞品顶级模型,仅使用约三分之一输出tokens。但OpenAI确认其未跨过Preparedness Framework中的网络安全关键风险阈值,无法自主生成完整攻击链。
- 安全体系:构建分层安全栈,涵盖模型拒答、实时检测、账号审查等环节,能力越强防护越严格。投入超70万A100等效GPU小时进行自动化红队测试,辅以人工专家测试,建立快速响应修复机制。
- 发布限制:GPT-5.6仅向约20家经美国政府批准的可信合作伙伴开放,合作伙伴信息已共享给美国政府。OpenAI强调不认为政府长期参与为默认机制,但为争取更广泛开放,接受该安排以探索可复制流程。
值得关注
前沿AI模型发布正被纳入国家安全框架。当模型能力逼近关键阈值,使用资格与管控将成为比性能更受关注的事项。
