GPT-5.5 Instant 正式发布:幻觉率降52.5%,新增个性化记忆,奥特曼按AI建议办派对
OpenAI 将 GPT-5.5 Instant 设为 ChatGPT 默认模型,面向所有用户开放。新模型在准确性、简洁性和个性化上显著提升,高风险领域幻觉率下降 52.5%,数学测试得分大幅提高。同时上线“记忆来源”功能,允许用户查看并管理被调用的个人背景信息。奥特曼还根据模型建议举办了一场派对,并公开邀请马斯克。
OpenAI 已推送 GPT-5.5 Instant,即日起取代 GPT-5.3 Instant 成为 ChatGPT 的默认日常模型,面向所有用户开放。
性能提升
- 高风险领域(医疗、法律、金融)幻觉率较上一版本下降 52.5%;用户标记过的错误对话错误率减少 37.3%。
- 数学与科学能力跃升:AIME 2025 数学测试得分从 65.4 升至 81.2;博士级科学测试 GPQA 从 78.5 升至 85.6;多模态推理基准 MMMU-Pro 从 69.2 升至 76;科学图表理解 CharXiv 从 75 升至 81.6;文档解析错误率从 14.6% 降至 12.5%。
- 实例:面对代数题的错误展开,旧模型直接判定“无实数解”,新模型能定位具体错误并给出正确解答。
回复风格
新模型更简短,减少格式堆砌、表情符号和不必要的追问。同一问题下回复字数减少 30.2%,行数减少 29.2%,语气更自然。
个性化与记忆
Plus 和 Pro 用户可让模型调取历史对话、上传文件及关联的 Gmail 内容,获得贴合个人情况的回答。所有消费者版本上线“记忆来源”功能:当回答用到个人背景信息时,用户可查看具体调用的历史对话或记忆条目,并随时删除或修正。临时对话模式不会读取或更新任何记忆。
GPT-5.3 Instant 将在三个月后下线。个性化功能目前对 Plus/Pro 网页端开放,移动端及其他版本后续推送。开发者可通过 API 以 chat-latest 名称调用。
AI 策划的派对
奥特曼在筹备上线派对时询问模型意愿,模型给出了详细清单:派对定于美国时间 5 月 5 日下午 5 点 55 分,演讲简短,人类创造者上台祝酒,模型自身不上台;现场设收集 GPT-5.6 建议的环节。地点为 OpenAI 旧金山总部,OpenAI 负责非本地嘉宾的机票酒店。受邀名单由 Codex 从推文回复筛选,24 小时内超 8000 人报名。未被选中的用户获得 10 倍 Codex 调用额度(有效期至 6 月 5 日)。奥特曼回应戏称马斯克也可来,但马斯克当前忙于诉讼。
