GOVERNANCE MEDIUM NEW

Divulgation à la vitesse machine : leçons du premier registre de vulnérabilités IA

Le registre de divulgation coordonnée d'Anthropic, analysé par VulnCheck le 9 juin 2026, montre l'IA remontant 23 019 bugs candidats quand seuls 1 596 atteignent les mainteneurs — un aperçu de la divulgation à l'ère de la découverte automatisée.

2026-06-16 // 8 min affects: open-source-software, vulnerability-disclosure, psirt-teams, maintainers

De quoi s’agit-il ?

En février 2026, Anthropic a commencé à utiliser un instantané précoce de son modèle Claude Mythos Preview pour détecter des failles de sécurité dans des logiciels open source, puis a publié un registre public de divulgation coordonnée (CVD) pour suivre ce qu’elle divulguait. Le 9 juin 2026, Patrick Garrity, de VulnCheck, a analysé ce registre, et les chiffres racontent une histoire qui dépasse largement une seule entreprise : la découverte assistée par IA génère des vulnérabilités candidates bien plus vite que le processus humain de triage, de divulgation et de correction ne peut les absorber.

Il ne s’agit ni d’une vulnérabilité ni d’une attaque. C’est le premier exemple public et auditable de ce à quoi ressemble la divulgation coordonnée quand le versant découverte est automatisé — et un avant-goût de la tension que tout l’écosystème s’apprête à ressentir. Cet article complète notre couverture de la première vague de CVE et des zero-days écrits par IA.

Comment ça marche

Le pipeline d’Anthropic a un entonnoir large et un goulet étroit. Selon l’instantané du registre daté du 22 mai 2026 :

23 019 résultats candidats ont été remontés par le modèle.
1 900 ont été examinés par l’une des six entreprises externes de recherche en sécurité ; 1 726 ont été confirmés valides (un taux de vrais positifs de 90,8 % sur ce qui a été examiné).
1 596 résultats ont effectivement été signalés aux mainteneurs sur 281 projets — 467 validés-et-signalés, plus 1 129 transmis directement à la demande des mainteneurs, sans triage indépendant.
1 451 ont été accusés réception, 97 ont été corrigés en amont et 88 ont reçu un CVE ou un GitHub Security Advisory.

Pour préserver l’antériorité sans divulguer le détail, chaque résultat divulgué encore dans sa fenêtre est publié sous forme d’un engagement par condensat SHA-3-512 du rapport scellé — une preuve que le résultat existait à une date donnée, sans le révéler. La politique CVD d’Anthropic (mise à jour le 6 mars 2026) fixe une fenêtre de divulgation par défaut de 90 jours, un délai de 45 jours après un correctif avant le détail technique complet, une extension de 14 jours sur demande, un délai de 7 jours pour les bugs activement exploités, et la déférence au mainteneur sur la sévérité.

Pourquoi c’est important

Le goulet d’étranglement est humain, et le calcul est implacable. VulnCheck note qu’atteindre 1 596 mainteneurs — environ 6,9 % du vivier de candidats — a pris à peu près 60 jours ; à ce rythme, résorber l’arriéré prendrait de l’ordre de 2,4 ans. Pendant ce temps, le compte à rebours de divulgation tourne : Garrity a dénombré 10 résultats déjà au-delà de l’échéance des 90 jours, avec 168 autres l’atteignant sous 30 jours, face à un registre qui n’avait pas visiblement progressé depuis son lancement. Le risque est structurel : si un chercheur assisté par IA peut trouver ces bugs, un autre le peut aussi — y compris des adversaires — bien avant qu’un processus de coordination surchargé n’y parvienne.

Deux problèmes de qualité des données aggravent le tableau. D’abord, la cartographie CVE est incomplète : VulnCheck a relevé que seules 14 entrées du registre portaient un CVE alors qu’elles en ont toutes un, ce qui rend la trace publique difficile à corréler. Ensuite, le modèle surévalue la sévérité : la propre matrice d’accord de sévérité d’Anthropic montre 58,7 % d’accord exact avec les entreprises externes (94,4 % à une bande près), Claude tirant vers le haut faute de contexte de sévérité propre au projet au moment de l’exécution. Bruce Schneier a posé l’enjeu plus large le 1er juin 2026, en relayant l’argument de Melissa Hathaway selon lequel la divulgation responsable ne peut plus être un processus réactif et fragmenté. Cela fait écho à la pression de gouvernance observée lors de la suspension de Fable 5 / Mythos 5 et des CVE créditées à Claude chez Apple.

Défenses

La leçon s’adresse aux défenseurs qui consomment la divulgation, pas seulement à ceux qui la produisent.

Mainteneurs et PSIRT : imposez un rythme d’admission et exigez le triage. La politique d’Anthropic s’engage déjà à ne pas inonder un projet et à effectuer une revue humaine avant signalement ; tenez tout rapporteur assisté par IA à ce standard. Traitez les résultats non triés transmis en divulgation directe comme des candidats, pas comme des bugs confirmés.
Ne faites pas confiance à la sévérité attribuée par l’IA. Re-scorez chaque résultat avec votre propre vecteur CVSS et votre modèle de menace. Un modèle qui qualifie des bugs de « critiques » sans contexte projet gonflera votre file et détournera la remédiation.
Corrélez par CVE/GHSA, pas par identifiants éditeur. Lorsqu’un registre omet le CVE, faites la cartographie vous-même (les enregistrements publics existent) afin qu’un même bug signalé par plusieurs outils IA ne devienne pas du travail en double.
Anticipez les collisions et l’arriéré. Attendez-vous à ce que des chercheurs IA indépendants trouvent les mêmes failles ; priorisez le déploiement des correctifs plutôt que l’attente d’un coordinateur unique. Supposez que certains résultats valides resteront non divulgués au-delà de 90 jours.
Investissez côté remédiation. La découverte est désormais bon marché ; le triage validé, la coordination et la correction automatisée sont les ressources rares. Financez-les, et traitez le registre publié comme un point de départ à vérifier — pas comme un dossier achevé.

Statut

Élément	Valeur
Sujet	Registre de divulgation coordonnée d’Anthropic (Claude Mythos Preview)
Instantané	22 mai 2026
Candidats → signalés	23 019 → 1 596 (sur 281 projets)
Corrigés / advisories	97 corrigés · 88 CVE/GHSA
Accord de sévérité	58,7 % exact, 94,4 % à une bande près (n=463) ; le modèle tire vers le haut
Analyse indépendante	VulnCheck (Patrick Garrity), 9 juin 2026
Fenêtre de politique	90 jours par défaut · 45 jours post-correctif · extension 14 jours · 7 jours si exploité
Statut	Observation de processus/gouvernance — aucun exploit, aucun payload actionnable