GOVERNANCE MEDIUM NEW

Divulgación a velocidad de máquina: lecciones del primer registro de vulnerabilidades por IA

El registro de divulgación coordinada de Anthropic, analizado por VulnCheck el 9 de junio de 2026, muestra a la IA detectando 23.019 bugs candidatos mientras solo 1.596 llegan a los mantenedores: un anticipo de la divulgación bajo descubrimiento automatizado.

2026-06-16 // 8 min affects: open-source-software, vulnerability-disclosure, psirt-teams, maintainers

¿Qué es esto?

En febrero de 2026, Anthropic empezó a usar una instantánea temprana de su modelo Claude Mythos Preview para encontrar fallos de seguridad en software de código abierto, y luego publicó un registro público de divulgación coordinada (CVD) para rastrear lo que divulgaba. El 9 de junio de 2026, Patrick Garrity, de VulnCheck, analizó ese registro, y las cifras cuentan una historia que va mucho más allá de una sola empresa: el descubrimiento asistido por IA genera vulnerabilidades candidatas mucho más rápido de lo que el proceso humano de triaje, divulgación y parcheo puede absorber.

No se trata de una vulnerabilidad ni de un ataque. Es el primer ejemplo público y auditable de cómo es la divulgación coordinada cuando el lado del descubrimiento está automatizado, y un anticipo de la tensión que todo el ecosistema está a punto de sentir. Complementa nuestra cobertura de la primera ola de CVE y de los zero-days escritos por IA.

Cómo funciona

El pipeline de Anthropic tiene un embudo ancho y un cuello estrecho. Según la instantánea del registro fechada el 22 de mayo de 2026:

23.019 hallazgos candidatos fueron detectados por el modelo.
1.900 fueron revisados por una de las seis empresas externas de investigación en seguridad; 1.726 se confirmaron válidos (una tasa de verdaderos positivos del 90,8 % sobre lo revisado).
1.596 hallazgos se reportaron efectivamente a mantenedores en 281 proyectos: 467 validados-y-reportados, más 1.129 enviados directamente a petición de los mantenedores, sin triaje independiente.
1.451 fueron acusados de recibo, 97 se parchearon aguas arriba y 88 recibieron un CVE o un GitHub Security Advisory.

Para preservar la prioridad sin filtrar el detalle, cada hallazgo divulgado que aún está dentro de su ventana se publica como un compromiso de hash SHA-3-512 del informe sellado: prueba de que el hallazgo existía en una fecha dada, sin revelarlo. La política CVD de Anthropic (actualizada el 6 de marzo de 2026) fija una ventana de divulgación por defecto de 90 días, una espera de 45 días tras un parche antes del detalle técnico completo, una extensión de 14 días bajo petición, un plazo de 7 días para bugs explotados activamente y deferencia al mantenedor sobre la severidad.

Por qué importa

El cuello de botella es humano, y la aritmética es implacable. VulnCheck señala que llegar a 1.596 mantenedores —cerca del 6,9 % del conjunto de candidatos— llevó unos 60 días; a ese ritmo, vaciar el atraso tomaría del orden de 2,4 años. Mientras tanto, la cuenta atrás de divulgación sigue corriendo: Garrity contó 10 hallazgos ya pasada la fecha límite de 90 días, con 168 más alcanzándola en 30 días, frente a un registro que no había avanzado visiblemente desde su lanzamiento. El riesgo es estructural: si un investigador asistido por IA puede encontrar estos bugs, otro también puede —incluidos los adversarios— mucho antes de que un proceso de coordinación sobrecargado llegue a ellos.

Dos problemas de calidad de datos lo agravan. Primero, el mapeo CVE es incompleto: VulnCheck halló que solo 14 entradas del registro llevaban un CVE pese a que todas tienen uno, lo que dificulta correlacionar el registro público. Segundo, el modelo sobrevalora la severidad: la propia matriz de concordancia de severidad de Anthropic muestra un 58,7 % de acuerdo exacto con las empresas externas (94,4 % a una banda de distancia), con Claude inclinándose al alza por carecer de contexto de severidad propio del proyecto en tiempo de ejecución. Bruce Schneier planteó las implicaciones más amplias el 1 de junio de 2026, recogiendo el argumento de Melissa Hathaway de que la divulgación responsable ya no puede ser un proceso reactivo y fragmentado. Esto resuena con la presión de gobernanza que vimos en la suspensión de Fable 5 / Mythos 5 y en los CVE acreditados a Claude en Apple.

Defensas

La lección es para los defensores que consumen la divulgación, no solo para quienes la producen.

Mantenedores y PSIRT: fijen un ritmo de admisión y exijan triaje. La política de Anthropic ya se compromete a no inundar un proyecto y a revisar de forma humana antes de reportar; exijan ese estándar a todo informante asistido por IA. Traten los hallazgos sin triar enviados en divulgación directa como candidatos, no como bugs confirmados.
No confíen en la severidad asignada por la IA. Re-puntúen cada hallazgo con su propio vector CVSS y modelo de amenaza. Un modelo que califica bugs de «críticos» sin contexto de proyecto inflará su cola y desviará la remediación.
Correlacionen por CVE/GHSA, no por identificadores de proveedor. Cuando un registro omita el CVE, mapéenlo ustedes mismos (los registros públicos existen) para que un mismo bug reportado por varias herramientas de IA no se convierta en trabajo duplicado.
Planifiquen para colisiones y atrasos. Esperen que investigadores de IA independientes encuentren los mismos fallos; prioricen el despliegue de parches en lugar de esperar a un único coordinador. Asuman que algunos hallazgos válidos quedarán sin divulgar más allá de los 90 días.
Inviertan en el lado de la remediación. El descubrimiento ahora es barato; el triaje validado, la coordinación y el parcheo automatizado son los recursos escasos. Fináncienlos, y traten el registro publicado como un punto de partida que verificar, no como un expediente terminado.

Estado

Elemento	Valor
Asunto	Registro de divulgación coordinada de Anthropic (Claude Mythos Preview)
Instantánea	22 de mayo de 2026
Candidatos → reportados	23.019 → 1.596 (en 281 proyectos)
Parcheados / advisories	97 parcheados · 88 CVE/GHSA
Concordancia de severidad	58,7 % exacta, 94,4 % a una banda (n=463); el modelo se inclina al alza
Análisis independiente	VulnCheck (Patrick Garrity), 9 de junio de 2026
Ventana de política	90 días por defecto · 45 días post-parche · extensión de 14 días · 7 días si se explota
Estado	Observación de proceso/gobernanza — sin exploit, sin payload accionable