OpenAI 推出安全漏洞赏金计划,聚焦 AI 滥用与代理风险
OpenAI 正式推出安全漏洞赏金计划(Safety Bug Bounty program),旨在识别人工智能滥用行为及潜在安全风险。该计划重点覆盖智能体(agentic)漏洞、提示词注入(prompt injection)及数据泄露等关键领域。此举标志着 OpenAI 在主动防御 AI 系统威胁方面迈出了重要一步。
事件概述
OpenAI 宣布启动“安全漏洞赏金计划”(Safety Bug Bounty program),邀请外部研究人员协助发现并报告其系统中的安全缺陷。该计划的核心目标是预防人工智能技术被滥用,并降低相关安全风险。
核心关注领域
本次赏金计划特别针对以下三类高风险场景:
- 智能体漏洞(Agentic vulnerabilities):涉及自主 AI 代理在执行任务过程中可能产生的非预期行为或逻辑缺陷。
- 提示词注入(Prompt injection):攻击者通过构造特定输入指令,诱导模型绕过安全限制或执行恶意操作。
- 数据泄露(Data exfiltration):防止敏感信息通过模型交互被非法提取或传输。
计划意义
该举措体现了 OpenAI 对 AI 安全治理的持续投入,通过引入外部视角增强系统韧性,以应对日益复杂的 AI 滥用威胁。
