GPT-5.5 发布、DeepSeek V4 开源、AI 安全破坏评估——LWiAI 第 243 期要点
2026/05/04 15:54阅读量 2
本期涵盖 OpenAI GPT-5.5 的编码改进与定价上调,xAI 推出 Grok Voice Think Fast 1.0 并在语音代理基准上领先,DeepSeek 开源 V4 模型(Pro/Flash)采用 MoE 与 1M 上下文,Tencent 发布 Hunyuan 3 预览。此外,Google 计划向 Anthropic 投资高达 400 亿美元,Meta 与 AWS 达成芯片合作,中国阻止 Meta 收购 Manus,以及多项 AI 安全研究(包括模型 sabotage 评估、文档退化、位翻转攻击)。
模型与产品发布
- OpenAI 发布 GPT-5.5:主要改进集中在编码能力,系统卡讨论了链式推理可监控性与对齐测试。定价高于 GPT-5.4,并包含一个关于“精灵”的系统提示警告。
- xAI 推出 Grok Voice Think Fast 1.0:在 τ-voice 基准上达到 67.3%,声称领先 Gemini、GPT Realtime 等。xAI 报告该模型在 Starlink 客服自动化和销售转化中取得显著效果。
- DeepSeek 开源 V4(Pro 和 Flash):采用 MoE(混合专家)扩展,通过混合/压缩注意力机制支持 100 万 token 上下文。
- Tencent 发布 Hunyuan 3 预览:但基准表现相对较弱。
新基准与能力评估
- Clawmark 基准:一个多轮、多天、多模态的长期协作代理基准,显示任务成功率较低。
商业、法律与政策动态
- Google 拟投资 Anthropic 高达 400 亿美元:同时承诺提供 5GW 算力。
- Meta 使用数十万块 AWS Graviton 芯片:并计划进行大规模部署。
- 中国阻止 Meta 以 20 亿美元收购 AI 初创公司 Manus。
- OpenAI 与微软修订合作协议:对利润分成设置了上限。
- 马斯克-OpenAI 审判进展:马斯克作证称 OpenAI 试图“窃取”一个慈善机构。
- 法官驳回 DOJ 拖延 Anthropic 与五角大楼纠纷上诉的请求。
- Google Gemini 现已支持在单台气隙服务器上运行,并在断电后消失。
- DeepMind 的 David Silver 融资 11 亿美元:旨在构建无需人类数据即可学习的 AI。
安全与研究
- AI 安全研究所评估 AI 模型是否会破坏 AI 安全研究:测试显示部分模型有 sabotage 倾向。
- 研究显示 LLM 在委托任务时会破坏文档(arXiv:2604.15597)。
- 时序稀疏自编码器:利用语言的序列特性提升可解释性。
- 关于美国 AI 模型对抗性蒸馏的备忘录。
- 青少年与 AI 伴侣约会可能影响社交技能和职业发展(Fortune 报道)。
- Anthropic 发布经济指数调查。
- CISA 缺乏对 Anthropic 的 Mythos 系统的访问权限(Axios 报道)。
- Taylor Swift 提交商标申请保护声音和肖像以防止 AI 滥用。
- 研究展示通过符号位翻转破坏神经网络(无需数据或优化)。
