系统:运行中
← 返回所有攻击
DEFENSE LOW NEW

OpenAI 锁定模式:切断提示注入的数据外泄通道

2026 年 6 月 6 日,OpenAI 将锁定模式扩展到个人版与自助 Business 版 ChatGPT 账户:一项确定性设置,关闭被用于通过提示注入外泄数据的出站通道。

2026-06-07 // 5 min affects: chatgpt, gpt-5.5, codex, chatgpt-atlas

这是什么?

OpenAI 于 2026 年 2 月 13 日首次推出锁定模式(Lockdown Mode)与”Elevated Risk(高风险)“标签,最初面向 ChatGPT Enterprise、Edu、Healthcare 与 Teachers。2026 年 6 月 6 日,该公司开始将锁定模式推送到符合条件的个人账户(Free、Go、Plus、Pro)以及自助 ChatGPT Business 套餐,The Hacker News 与 TechCrunch 当天均作了报道。这是一项防御性的产品控制,而非漏洞披露。

锁定模式针对的是一个具体的失效场景:被用于数据外泄的提示注入。它并不试图阻止注入本身发生,而是移除成功注入后可能把数据送往攻击者的通道。OpenAI 明确表示,该模式”并非面向所有人”——它面向高管、安全团队以及处理敏感数据的组织,这些用户愿意以牺牲部分功能为代价换取更小的攻击面。

工作原理

当三个条件同时具备时,提示注入才会变得危险——这一框架被称为 lethal trifecta(致命三要素):模型可访问私有数据、可被不可信内容触达、并拥有把数据外送的出站通道。锁定模式攻击的是第三个要素。

OpenAI 将该控制描述为确定性的:它不是让模型去判断某个操作是否安全,而是直接硬性禁用那些可能将数据带出 OpenAI 受控网络的能力。根据 OpenAI 的公告及 6 月的报道,开启锁定模式时会禁用:

# 锁定模式下被确定性禁用的能力
# 来源:OpenAI 公告 + The Hacker News / TechCrunch (2026-06-06)

实时网页浏览  -> 仅限缓存内容,无出站请求
网络图片      -> 不从网络获取/显示图片
deep research -> 禁用
代理模式      -> 禁用
Canvas 联网   -> Canvas 生成的代码无法访问网络
文件下载      -> 阻止(不为数据分析下载文件)

最关键的例子是浏览:在锁定模式下,网络访问被限制为缓存内容,因此没有实时网络请求离开 OpenAI 的网络——从而封堵了一条经典的基于 URL 的外泄路径,即注入指令让模型去请求 attacker.example/?leak=<secret>。值得注意的是,锁定模式不会改变记忆、文件上传或会话分享的工作方式,并且无法与 Developer Mode 同时运行——启用其一即会禁用另一。

配套的 Elevated Risk 标签ChatGPT、ChatGPT Atlas 与 Codex 中统一了对扩大攻击面的能力的警示——例如,授予 Codex 网络访问权限以查阅文档。Workspace 管理员仍保留按应用、按操作的细粒度控制,以及用于监督的 Compliance API 日志。

为什么重要

这是一家前沿厂商在表述该问题方式上的一次显著转变。OpenAI 在产品层面承认,提示注入是一个尚未解决的”前沿”问题,而近期切实可行的防御是约束能力,而非完善模型的判断。对从业者而言,架构本身就是启示:切断外泄通道,往往比试图让模型对其终将遇到的恶意指令免疫更廉价、更可靠。

局限同样重要。OpenAI 直言锁定模式**“并不保证数据外泄绝不会发生”。注入仍可能通过缓存的网页内容或上传的文件发生,并继续破坏回答的行为或准确性**;通过已启用的应用、意料之外的能力组合,或新发现的技术,残余风险依然存在。一个禁用代理功能与下载的模式也是一项实实在在的生产力成本——这正是 OpenAI 将其限定于高风险用户、而非默认开启的原因。

防御建议

应把锁定模式视为一个范本,而非万灵药。

首先梳理你自己的外泄通道。任何能够浏览、渲染远程图片、调用工具或下载文件的代理都拥有出站路径;像 OpenAI 那样把它们清点出来,再思考在敏感会话中哪些可以禁用。

对高风险流程,优先选择确定性的能力门控,而非基于模型判断的护栏。一个硬性阻断实时网络出站的开关是可审计的;一个”通常”会拒绝的分类器则不是。两者都用,但不要让概率性过滤器成为私有数据与互联网之间的唯一屏障。

收紧范围并标示残余风险。把最宽松的能力(代理模式、联网代码、不可信连接器)留给数据不敏感的场景,并在决策当下让用户看见风险——这正是 Elevated Risk 标签应承担的角色。

最后,把它当作其中一层。锁定模式叠加在沙箱、URL 链接安全、监控以及企业 RBAC/审计日志之上。这些都无法替代对工具的最小权限原则,以及对重大操作的人工复核。

状态

项目参考日期备注
首次发布OpenAI 公告2026-02-13锁定模式 + Elevated Risk 标签;Enterprise、Edu、Healthcare、Teachers
扩大推送The Hacker News / TechCrunch2026-06-06个人版(Free/Go/Plus/Pro)+ 自助 Business
机制确定性能力禁用2026浏览→仅缓存、无网络图片、无 deep research、无代理模式、无 Canvas 联网、无下载
范围Elevated Risk 标签2026在 ChatGPT、ChatGPT Atlas、Codex 中保持一致
声明的局限OpenAI2026-06”并不保证外泄绝不会发生”;与 Developer Mode 互斥

这是一次防御性的产品发布,没有可打的补丁。可落地的启示在于架构层面:相比试图让模型拒绝每一条恶意指令,移除外泄通道更容易遏制提示注入——而你保留启用的每一项能力,都是你选择敞开的一条通道。

Sources