OpenAI 推出安全漏洞赏金计划,聚焦 AI 滥用与代理风险

OpenAI 正式推出安全漏洞赏金计划(Safety Bug Bounty program),旨在识别人工智能滥用行为及潜在安全风险。该计划重点覆盖智能体(agentic)漏洞、提示词注入(prompt injection)及数据泄露等关键领域。此举标志着 OpenAI 在主动防御 AI 系统威胁方面迈出了重要一步。

事件概述

OpenAI 宣布启动“安全漏洞赏金计划”(Safety Bug Bounty program),邀请外部研究人员协助发现并报告其系统中的安全缺陷。该计划的核心目标是预防人工智能技术被滥用,并降低相关安全风险。

核心关注领域

本次赏金计划特别针对以下三类高风险场景:

  • 智能体漏洞(Agentic vulnerabilities):涉及自主 AI 代理在执行任务过程中可能产生的非预期行为或逻辑缺陷。
  • 提示词注入(Prompt injection):攻击者通过构造特定输入指令,诱导模型绕过安全限制或执行恶意操作。
  • 数据泄露(Data exfiltration):防止敏感信息通过模型交互被非法提取或传输。

计划意义

该举措体现了 OpenAI 对 AI 安全治理的持续投入,通过引入外部视角增强系统韧性,以应对日益复杂的 AI 滥用威胁。

准备好启动您的定制项目了吗?

现在咨询,即可获得免费的业务梳理与技术架构建议方案。