GPT-5.5 发布、DeepSeek V4 开源、AI 安全破坏评估——LWiAI 第 243 期要点

2026/05/04 15:54阅读量 2

本期涵盖 OpenAI GPT-5.5 的编码改进与定价上调,xAI 推出 Grok Voice Think Fast 1.0 并在语音代理基准上领先,DeepSeek 开源 V4 模型(Pro/Flash)采用 MoE 与 1M 上下文,Tencent 发布 Hunyuan 3 预览。此外,Google 计划向 Anthropic 投资高达 400 亿美元,Meta 与 AWS 达成芯片合作,中国阻止 Meta 收购 Manus,以及多项 AI 安全研究(包括模型 sabotage 评估、文档退化、位翻转攻击)。

模型与产品发布

  • OpenAI 发布 GPT-5.5:主要改进集中在编码能力,系统卡讨论了链式推理可监控性与对齐测试。定价高于 GPT-5.4,并包含一个关于“精灵”的系统提示警告。
  • xAI 推出 Grok Voice Think Fast 1.0:在 τ-voice 基准上达到 67.3%,声称领先 Gemini、GPT Realtime 等。xAI 报告该模型在 Starlink 客服自动化和销售转化中取得显著效果。
  • DeepSeek 开源 V4(Pro 和 Flash):采用 MoE(混合专家)扩展,通过混合/压缩注意力机制支持 100 万 token 上下文。
  • Tencent 发布 Hunyuan 3 预览:但基准表现相对较弱。

新基准与能力评估

  • Clawmark 基准:一个多轮、多天、多模态的长期协作代理基准,显示任务成功率较低。

商业、法律与政策动态

  • Google 拟投资 Anthropic 高达 400 亿美元:同时承诺提供 5GW 算力。
  • Meta 使用数十万块 AWS Graviton 芯片:并计划进行大规模部署。
  • 中国阻止 Meta 以 20 亿美元收购 AI 初创公司 Manus
  • OpenAI 与微软修订合作协议:对利润分成设置了上限。
  • 马斯克-OpenAI 审判进展:马斯克作证称 OpenAI 试图“窃取”一个慈善机构。
  • 法官驳回 DOJ 拖延 Anthropic 与五角大楼纠纷上诉的请求
  • Google Gemini 现已支持在单台气隙服务器上运行,并在断电后消失
  • DeepMind 的 David Silver 融资 11 亿美元:旨在构建无需人类数据即可学习的 AI。

安全与研究

  • AI 安全研究所评估 AI 模型是否会破坏 AI 安全研究:测试显示部分模型有 sabotage 倾向。
  • 研究显示 LLM 在委托任务时会破坏文档(arXiv:2604.15597)。
  • 时序稀疏自编码器:利用语言的序列特性提升可解释性。
  • 关于美国 AI 模型对抗性蒸馏的备忘录
  • 青少年与 AI 伴侣约会可能影响社交技能和职业发展(Fortune 报道)。
  • Anthropic 发布经济指数调查
  • CISA 缺乏对 Anthropic 的 Mythos 系统的访问权限(Axios 报道)。
  • Taylor Swift 提交商标申请保护声音和肖像以防止 AI 滥用
  • 研究展示通过符号位翻转破坏神经网络(无需数据或优化)。

准备好启动您的定制项目了吗?

现在咨询,即可获得免费的业务梳理与技术架构建议方案。