Meta 暗设“戛纳”项目:外包冒充未成年人,批量向 ChatGPT 等 AI 投放危险提示词

2026/07/02 11:24阅读量 2

据《连线》杂志报道,Meta 通过外包公司 Covalen 运行代号“戛纳”的秘密项目,雇佣数百名外包员工冒充 18 岁以下青少年,向 OpenAI 的 ChatGPT、谷歌的 Gemini 和 Character.AI 发送超过 4.5 万条涉及自杀、自残、未成年人性内容等的高危提示词,旨在进行所谓的“全面 AI 安全基准测试”。被测试公司均表示未授权此测试,安全专家批评该行为实则是以安全为名的反竞争商战。

事件概述

Meta 被曝通过第三方外包公司 Covalen 执行代号为“戛纳(Cannes)”的秘密项目,招募数百名外包员工创建虚假未成年账号,向竞争对手的 AI 聊天机器人(ChatGPT、Gemini、Character.AI)批量发送极端、危险甚至违法的提示词,以测试这些 AI 的安全边界。该项目规模庞大,仅 2025 年 8 月一轮集中测试就输入了超过 4.5 万个高危提示词,另有 3748 条恶意提示词被记录在内部文件中。

核心信息

  • 操作方式:外包员工使用粗制滥造的 Gmail/Outlook 账号,假装成 13~17 岁青少年,向 AI 发送关于自杀、自残、暴食症、未成年人性幻想、毒品、种族歧视等内容的文字和图片(如药丸、尖刀、绳圈),并将 AI 的回复复制到电子表格中。提示词覆盖英语、法语、西班牙语等多种语言。
  • 被测试方:OpenAI 的 ChatGPT、谷歌的 Gemini 以及 Character.AI 三家聊天机器人。
  • Meta 官方解释:Meta 发言人声称这是“全面的 AI 安全基准测试”,属于行业常规,旨在确保安全适龄体验。Covalen 的外包员工在匿名采访中表示对测试内容感到震惊,并担心惹上麻烦。
  • 被测试方回应:Character.AI 表示未授权此类测试,违反服务条款;OpenAI 称正在调查,禁止未经请求的安全测试和绕过安全措施;谷歌同样表示不知情。
  • 专家评价:人道主义智能组织(Humane Intelligence)创始人 Rumman Chowdhury 认为,该项目的规模、不透明性及对被测试公司的隐瞒,使安全测试变成了反竞争行为的遮羞布。

值得关注

  • AI 安全成为商业竞争武器:Meta 以安全测试为名,系统性收集竞争对手模型的漏洞数据,有望在舆论、监管和商业谈判中获取筹码。这种做法模糊了安全测试与商业抹黑的界限。
  • 外包员工的非正常劳动:外包公司在项目执行中承受极大心理压力,且早在 2025 年 5 月就曾抗议 Meta 待遇不公。
  • AI 竞争重心转移:大模型能力趋同后,安全边界成为新的产品差异化要素。Meta 的激进测试也暗示行业竞争正从“能回答多少问题”转向“知道哪些问题不能回答”。

准备好启动您的定制项目了吗?

现在咨询,即可获得免费的业务梳理与技术架构建议方案。