OpenAI 推出安全漏洞赏金计划，聚焦 AI 滥用与代理风险

2026/03/25 08:00阅读量 19

OpenAI 正式推出安全漏洞赏金计划（Safety Bug Bounty program），旨在识别人工智能滥用行为及潜在安全风险。该计划重点覆盖智能体（agentic）漏洞、提示词注入（prompt injection）及数据泄露等关键领域。此举标志着 OpenAI 在主动防御 AI 系统威胁方面迈出了重要一步。

事件概述

OpenAI 宣布启动“安全漏洞赏金计划”（Safety Bug Bounty program），邀请外部研究人员协助发现并报告其系统中的安全缺陷。该计划的核心目标是预防人工智能技术被滥用，并降低相关安全风险。

核心关注领域

本次赏金计划特别针对以下三类高风险场景：

智能体漏洞（Agentic vulnerabilities）：涉及自主 AI 代理在执行任务过程中可能产生的非预期行为或逻辑缺陷。
提示词注入（Prompt injection）：攻击者通过构造特定输入指令，诱导模型绕过安全限制或执行恶意操作。
数据泄露（Data exfiltration）：防止敏感信息通过模型交互被非法提取或传输。

计划意义

该举措体现了 OpenAI 对 AI 安全治理的持续投入，通过引入外部视角增强系统韧性，以应对日益复杂的 AI 滥用威胁。

阅读原文详情

事件概述

核心关注领域

计划意义

准备好启动您的定制项目了吗？