GPT-5.5 发布、DeepSeek V4 开源、AI 安全破坏评估——LWiAI 第 243 期要点

2026/05/04 15:54阅读量 2

本期涵盖 OpenAI GPT-5.5 的编码改进与定价上调，xAI 推出 Grok Voice Think Fast 1.0 并在语音代理基准上领先，DeepSeek 开源 V4 模型（Pro/Flash）采用 MoE 与 1M 上下文，Tencent 发布 Hunyuan 3 预览。此外，Google 计划向 Anthropic 投资高达 400 亿美元，Meta 与 AWS 达成芯片合作，中国阻止 Meta 收购 Manus，以及多项 AI 安全研究（包括模型 sabotage 评估、文档退化、位翻转攻击）。

模型与产品发布

OpenAI 发布 GPT-5.5：主要改进集中在编码能力，系统卡讨论了链式推理可监控性与对齐测试。定价高于 GPT-5.4，并包含一个关于“精灵”的系统提示警告。
xAI 推出 Grok Voice Think Fast 1.0：在 τ-voice 基准上达到 67.3%，声称领先 Gemini、GPT Realtime 等。xAI 报告该模型在 Starlink 客服自动化和销售转化中取得显著效果。
DeepSeek 开源 V4（Pro 和 Flash）：采用 MoE（混合专家）扩展，通过混合/压缩注意力机制支持 100 万 token 上下文。
Tencent 发布 Hunyuan 3 预览：但基准表现相对较弱。

新基准与能力评估

Clawmark 基准：一个多轮、多天、多模态的长期协作代理基准，显示任务成功率较低。

商业、法律与政策动态

Google 拟投资 Anthropic 高达 400 亿美元：同时承诺提供 5GW 算力。
Meta 使用数十万块 AWS Graviton 芯片：并计划进行大规模部署。
中国阻止 Meta 以 20 亿美元收购 AI 初创公司 Manus。
OpenAI 与微软修订合作协议：对利润分成设置了上限。
马斯克-OpenAI 审判进展：马斯克作证称 OpenAI 试图“窃取”一个慈善机构。
法官驳回 DOJ 拖延 Anthropic 与五角大楼纠纷上诉的请求。
Google Gemini 现已支持在单台气隙服务器上运行，并在断电后消失。
DeepMind 的 David Silver 融资 11 亿美元：旨在构建无需人类数据即可学习的 AI。

安全与研究

AI 安全研究所评估 AI 模型是否会破坏 AI 安全研究：测试显示部分模型有 sabotage 倾向。
研究显示 LLM 在委托任务时会破坏文档（arXiv:2604.15597）。
时序稀疏自编码器：利用语言的序列特性提升可解释性。
关于美国 AI 模型对抗性蒸馏的备忘录。
青少年与 AI 伴侣约会可能影响社交技能和职业发展（Fortune 报道）。
Anthropic 发布经济指数调查。
CISA 缺乏对 Anthropic 的 Mythos 系统的访问权限（Axios 报道）。
Taylor Swift 提交商标申请保护声音和肖像以防止 AI 滥用。
研究展示通过符号位翻转破坏神经网络（无需数据或优化）。

阅读原文详情

模型与产品发布

新基准与能力评估

商业、法律与政策动态

安全与研究

准备好启动您的定制项目了吗？