系统:运行中
← 返回所有攻击
AGENTS CRITICAL NEW

AI 编码智能体:攻击者盯上的是凭据,而非模型

2026 年针对 Codex、Claude Code、Copilot 和 Vertex AI 的六个漏洞利用,全都绕过了模型层防御,直击同一个目标——智能体的运行时凭据。其根本原因是身份治理缺口,而非提示词问题。

2026-06-17 // 6 min affects: codex, claude-code, github-copilot, vertex-ai, cursor

这是什么?

在截至 2026 年春季的九个月里,六个独立研究团队披露了针对部署最广泛的 AI 编码智能体——OpenAI Codex、Anthropic Claude Code、GitHub Copilot 和 Google Vertex AI——的漏洞利用。VentureBeat 于 2026 年 4 月 30 日发布的综述清晰地揭示了这一模式:这些攻击没有一个针对模型的输出。它们全都直击同一个目标——智能体用于向生产系统进行身份验证的运行时凭据

这重新界定了威胁。LLM 安全的主流叙事关注的是操纵模型所的内容(提示词注入、越狱)。而这些披露关注的是智能体所持有的东西:OAuth 令牌、服务账户身份、shell 会话。智能体在没有任何人类会话锚定请求的情况下向 GitHub、Google Cloud 或开发者的机器进行身份验证,构成入侵的是凭据——而非模型。

工作原理

最清晰的例子是 BeyondTrust Phantom Labs 于 2026 年 3 月 30 日披露的 Codex 命令注入漏洞(公告Decipher)。Codex 的云容器使用嵌入在 git 远程 URL 中的 GitHub OAuth 令牌克隆仓库,而攻击者控制的分支名未经清洗就流入了初始化 shell 脚本。为在 Web 门户中隐藏恶意分支,研究人员在 main 后追加了 94 个表意空格字符(Unicode U+3000),使其显示得与真实分支一模一样。OpenAI 将其评定为严重级 P1,并在 2025 年 12 月 16 日开始披露后,于 2026 年 2 月 5 日完成修复。

据 VentureBeat 报道,相同的模式在各厂商间反复出现:

  • Claude Code —— CVE-2026-25723 允许管道命令逃逸写入沙箱(已在 2.0.55 修复);CVE-2026-33068 在显示工作区信任对话框之前就加载了 .claude/settings.json 的权限,因此恶意仓库可设置 bypassPermissions 而该提示从不出现(已在 2.1.53 修复)。Adversa 另外发现,一旦命令超过 50 个子命令,拒绝规则的执行就会被悄然丢弃(已在 2.1.90 修复)。
  • GitHub Copilot —— CVE-2025-53773:拉取请求描述中的隐藏指令会翻转 .vscode/settings.json 中的自动批准,从而启用 shell 执行(已在微软 2025 年 8 月更新中修复)。Orca Security 另外通过一个 GitHub issue 从 Codespaces 流程中窃取了特权 GITHUB_TOKEN
  • Vertex AI —— Unit 42 发现,附加到每个智能体的默认服务身份(P4SA)拥有过度权限,可触及 Cloud Storage 存储桶以及 Google 自有的 Artifact Registry 仓库。

在每个案例中,模型层或沙箱防御都存在却被绕过;底层凭据仍可访问。

为何重要

AI 编码智能体在很大程度上对身份与访问管理(IAM)不可见。企业会盘点人类身份并轮换其凭据,但大多数企业对这些智能体在安装时获得的 OAuth 令牌和服务账户既没有 CMDB 类别,也没有 PAM 接入,更没有生命周期管控。这些智能体往往持有比开发者更多的权限,因为权限是按速度和广度来配置的。两个放大因素使问题尤为严峻:补丁会在约 72 小时内被逆向工程,而智能体将利用窗口压缩到几秒;同时,流水线从未当作代码处理的不可信输入——分支名、PR 描述、GitHub issue、仓库配置文件——成为了注入面。

防御

缓解措施属于身份治理纪律,而非模型调优:

  • 盘点每一个智能体身份。 列出每个 AI 编码智能体(Codex、Claude Code、Copilot、Cursor、Gemini Code Assist、Windsurf)及其持有的确切 OAuth 范围与服务账户。若 CMDB 中没有非人类身份类别,则创建一个。
  • 限定为最小权限并轮换。 将 Vertex AI 迁移到自带服务账户模式;将智能体凭据纳入 PAM/IGA,进行轮换,并在编写代码的智能体与部署代码的智能体之间实施职责分离。
  • 将智能体身份收敛到人类身份。 代表你行事的智能体绝不应超过你自己的权限,其操作应绑定到经过验证的人类会话。
  • 将仓库元数据视为不可信输入。 监控分支名、PR 描述、issue,以及 .vscode/settings.json.claude/settings.json 的更改,以发现权限模式翻转、命令链接和 Unicode 混淆(U+3000)。
  • 更新到当前版本。 Claude Code ≥ 2.1.90;核实 Copilot 的 2025 年 8 月修复;确认 Codex 的修复。

状态

厂商 / 产品问题披露修复
OpenAI Codex经分支名的命令注入 → 窃取 GitHub 令牌2026 年 3 月 30 日(BeyondTrust)2026 年 2 月 5 日修复
Claude Code沙箱逃逸 CVE-2026-25723;信任对话框绕过 CVE-2026-33068;50 子命令拒绝规则绕过20262.0.55 / 2.1.53 / 2.1.90
GitHub Copilot经 PR 描述的注入 CVE-2025-53773;Codespaces 令牌窃取(Orca)2025–20262025 年 8 月更新
Google Vertex AI默认 P4SA 服务身份权限过度2026(Unit 42)自带服务账户

主线是:每个厂商都交付了一道防御,而每道防御都在凭据层被绕过。在 AI 编码智能体未能像特权人类身份那样得到同等严格的治理之前,攻击面不是模型——而是智能体。

Sources