Meta 暗设“戛纳”项目：外包冒充未成年人，批量向 ChatGPT 等 AI 投放危险提示词

2026/07/02 11:24阅读量 2

据《连线》杂志报道，Meta 通过外包公司 Covalen 运行代号“戛纳”的秘密项目，雇佣数百名外包员工冒充 18 岁以下青少年，向 OpenAI 的 ChatGPT、谷歌的 Gemini 和 Character.AI 发送超过 4.5 万条涉及自杀、自残、未成年人性内容等的高危提示词，旨在进行所谓的“全面 AI 安全基准测试”。被测试公司均表示未授权此测试，安全专家批评该行为实则是以安全为名的反竞争商战。

事件概述

Meta 被曝通过第三方外包公司 Covalen 执行代号为“戛纳（Cannes）”的秘密项目，招募数百名外包员工创建虚假未成年账号，向竞争对手的 AI 聊天机器人（ChatGPT、Gemini、Character.AI）批量发送极端、危险甚至违法的提示词，以测试这些 AI 的安全边界。该项目规模庞大，仅 2025 年 8 月一轮集中测试就输入了超过 4.5 万个高危提示词，另有 3748 条恶意提示词被记录在内部文件中。

核心信息

操作方式：外包员工使用粗制滥造的 Gmail/Outlook 账号，假装成 13～17 岁青少年，向 AI 发送关于自杀、自残、暴食症、未成年人性幻想、毒品、种族歧视等内容的文字和图片（如药丸、尖刀、绳圈），并将 AI 的回复复制到电子表格中。提示词覆盖英语、法语、西班牙语等多种语言。
被测试方：OpenAI 的 ChatGPT、谷歌的 Gemini 以及 Character.AI 三家聊天机器人。
Meta 官方解释：Meta 发言人声称这是“全面的 AI 安全基准测试”，属于行业常规，旨在确保安全适龄体验。Covalen 的外包员工在匿名采访中表示对测试内容感到震惊，并担心惹上麻烦。
被测试方回应：Character.AI 表示未授权此类测试，违反服务条款；OpenAI 称正在调查，禁止未经请求的安全测试和绕过安全措施；谷歌同样表示不知情。
专家评价：人道主义智能组织（Humane Intelligence）创始人 Rumman Chowdhury 认为，该项目的规模、不透明性及对被测试公司的隐瞒，使安全测试变成了反竞争行为的遮羞布。

值得关注

AI 安全成为商业竞争武器：Meta 以安全测试为名，系统性收集竞争对手模型的漏洞数据，有望在舆论、监管和商业谈判中获取筹码。这种做法模糊了安全测试与商业抹黑的界限。
外包员工的非正常劳动：外包公司在项目执行中承受极大心理压力，且早在 2025 年 5 月就曾抗议 Meta 待遇不公。
AI 竞争重心转移：大模型能力趋同后，安全边界成为新的产品差异化要素。Meta 的激进测试也暗示行业竞争正从“能回答多少问题”转向“知道哪些问题不能回答”。

阅读原文详情

事件概述

核心信息

值得关注

准备好启动您的定制项目了吗？