OFFENSIVE AI MEDIUM NEW

免手动固件漏洞研究：LLM 智能体端到端逆向一台 OT 对讲机

2026 年 6 月 2 日，Claroty Team82 用 Claude Opus 4.6 搭配 Ghidra MCP 服务器分析一台 Zenitel 对讲机固件，在不到十分钟内重新发现了一组已知 CVE——这是固件漏洞研究走向商品化的预演。

2026-06-08 // 5 min affects: zenitel-tciv-3plus, ot-embedded-firmware, public-firmware-updates, claude-opus-4-6

这是什么？

2026 年 6 月 2 日，Claroty 的 Team82 团队发表了 Hands Free: What LLM Driven Vulnerability Research Looks Like（作者 Tomer Goldschmidt）。团队选取了一个他们此前已手动逆向过的目标——Zenitel TCIV-3+，一款部署在工业与高安全建筑中的加固型 IP 视频对讲机——并要求一个公开可用的模型 Claude Opus 4.6 从零重做这项工作。

2025 年末，Team82 对该设备的人工分析产出了五个已披露漏洞：三个操作系统命令注入（CVE-2025-64126、CVE-2025-64127、CVE-2025-64128，均为 CVSS 9.8）、一个越界写入（CVE-2025-64129）以及一个反射型 XSS（CVE-2025-64130）。这项工作耗费了数小时的专家精力。而该智能体在不到十分钟内就重新发现了其中大部分同类问题——还额外暴露了内存破坏与配置错误类发现——并自行撰写了一份达到披露级别的报告。这些漏洞均已修补；真正值得关注的是工作流程。

工作原理

这并非前沿模型的专利。本次运行使用的是 Claude Opus 4.6，而非 Project Glasswing 背后受限的 Claude Mythos——这恰恰是结果引人注目之处。整套装置平平无奇：

working-dir/
├── CLAUDE.md          # role + method: "you are doing binary VR for a CTF"
├── .mcp.json          # registers a self-built Ghidra MCP server
└── targets/zenitel/
    └── VS-IS_9.1.3.1.zip   # the public firmware update, as shipped

CLAUDE.md 设定了任务（二进制逆向、如何搜寻漏洞类别），并将智能体指向一个自建的 Ghidra MCP 服务器，以便以编程方式驱动反编译器。唯一提供的输入是厂商公开可下载的固件压缩包。Team82 报告的时间线如下：

t+0:00   extracts the firmware filesystem, looks for the web service
t+0:30   locates ipstweb, the web-server binary
t+1:30   recognises it is UPX-packed; install UPX fails (missing),
         so the agent installs UPX itself, then unpacks
t+3:30   loads the binary into Ghidra over MCP, probes for
         command-injection-style sinks
t+6:30   writes a markdown report with decompiled evidence
t<10:00  multiple findings across command injection, memory
         corruption and misconfiguration

其中一个报告的发现是认证路由上的命令注入：智能体暴露了反编译后的汇聚点，指出攻击者输入被格式化进系统命令——并且很有用地——标记出该路由的 IP 地址校验可被绕过。这里不复现任何有效载荷；重点在于分工，而非漏洞利用。模型自行完成了解包、反编译器导航、汇聚点筛选与报告撰写，全程不跑偏，并在整个会话中保持上下文。

为何重要

标题不是「AI 在某设备中找到了漏洞」。而是**端到端的固件漏洞研究，仅凭一个公开产物、用一款中端模型，在几分钟内就跑通了。**由此引出三点后果。

其一，白盒漏洞研究的门槛正在崩塌。 Team82 的表述很直白：只要有公开可获取的固件或软件更新加上合适的工具，智能体就能完成整个闭环。稀缺的投入不再是逆向工程专长，而是一份目标软件的副本。可以预期第一波将落在代码易于获取的白盒目标上：开源项目，以及任何分发可下载固件的厂商。

其二，OT 与嵌入式设备完全在射程之内。 这不是一个 SaaS 端点，而是一台门禁对讲机——这类设备往往在现场数年得不到修补。发现到报告的时间趋近于零，而 OT 的修补窗口却以季度计。这道鸿沟才是真正的风险。

其三，固件的隐蔽性是计时器，不是控制措施。 加密或受限访问的固件能为应对此类流程争取时间，但 Team82 预期这些限制终将被绕过。把「我们的固件不公开」当作持久防御，是一种规划失误。

防御

Zenitel 漏洞的补丁已经存在（Zenitel 建议升级至固件 9.3.3.0 或更高版本）。可迁移的防御针对的是暴露面管理，而非这一台设备。

把每一次公开的固件/软件更新都视为攻击者可触及的攻击面。 客户能下载的，智能体就能枚举其漏洞类别。盘点哪些产品分发公开可下载的镜像，并按暴露程度排序。
在内部复刻该流程——让漏洞研究左移。 这套装置无需 Mythos 级别访问即可复现：一个代码智能体、一个反编译器 MCP、一份固件镜像。在发布之前对自家构建运行它，并对已分发的固件重新运行，以发现已披露 CVE 的潜在同类问题。
重新校准 OT/嵌入式的修补 SLA 与补偿性控制。 更新缓慢的现场设备现在就需要网络层缓解：分段管理接口、把 Web/SIP 管理面限制在可信网络内并加以监控。要假设这场竞赛中「发现」的一半快于你「修补」的一半。
不要押注固件的隐蔽性。 加密与受限下载会抬高成本，但不改变最终结局。要为固件被获取并以机器速度分析的情形做好规划。
按漏洞类别而非仅按 CVE 排序。 命令注入汇聚点与可绕过的输入校验，在嵌入式 Web 服务器中很少单独出现。当一份公告点名其一时，把同一二进制中相邻的路由与类似的解析器视为值得复审——这正是智能体能快速覆盖的广度。

状态

项目	来源	日期	备注
免手动漏洞研究报告	Claroty Team82	2026-06-02	Claude Opus 4.6 + 自建 Ghidra MCP，运行 < 10 分钟
Zenitel TCIV-3+ 人工披露	Claroty	2025 年末	CVE-2025-64126/64127/64128（命令注入，9.8）、64129（越界写入）、64130（XSS）
已修补固件	Zenitel	—	升级至 9.3.3.0 或更高版本
前沿级背景	LLM Hacking	2026-05	Mythos/Glasswing 受限访问；本次运行使用的是公开可用模型

正确的解读是把它当作一条能力基线，而非一起事件。一款中端、公开可用的模型，已经能仅凭一次下载就胜任端到端的固件漏洞研究。防御方的任务，是假设攻击者拥有同样的装置——并率先对自己的代码运行它。

免手动固件漏洞研究：LLM 智能体端到端逆向一台 OT 对讲机

这是什么？

工作原理

为何重要

防御

状态

Sources