OFFENSIVE AI MEDIUM NEW

Zero-days écrits par IA : comment le GTIG a identifié le premier exploit bâti par un modèle

Le 11 mai 2026, le GTIG de Google a divulgué le premier zero-day qu'il estime conçu par IA — un script de contournement de 2FA trahi par un score CVSS halluciné et des docstrings de manuel. Voici comment lire ces indices.

2026-06-01 // 6 min affects: open-source-web-admin-tools, 2fa-implementations, frontier-llms

De quoi s’agit-il ?

Le 11 mai 2026, le Google Threat Intelligence Group (GTIG) a publié un rapport indiquant que, pour la première fois, il avait identifié un acteur malveillant exploitant un zero-day qu’il estime développé avec l’aide de l’IA. Un groupe criminel — décrit par le GTIG comme ayant « un solide historique d’incidents majeurs et d’exploitation de masse » — prévoyait de le déployer lors d’un événement d’exploitation de masse. Le GTIG affirme que sa « découverte proactive » a probablement empêché cela, en collaborant avec l’éditeur concerné pour divulguer et corriger la faille avant le lancement de la campagne.

L’exploit en lui-même est modeste : un script Python qui contourne l’authentification à deux facteurs (2FA) d’un outil d’administration système open source répandu, accessible par navigateur, et qui nécessite tout de même des identifiants valides. Ce qui rend cette divulgation digne d’intérêt, ce n’est pas le bug mais sa provenance : le script porte des empreintes observables d’une rédaction par modèle de langage, et la faille sous-jacente fait partie de celles que les outils classiques peinent à détecter.

Comment ça fonctionne

Deux éléments du compte rendu du GTIG comptent pour les défenseurs.

D’abord, la catégorie de faille. Il ne s’agissait pas d’une corruption mémoire ni d’une erreur d’assainissement des entrées, mais d’une faille de logique sémantique de haut niveau : le développeur avait codé en dur une hypothèse de confiance dans la logique d’application de la 2FA — une exception contredisant le contrôle qu’elle était censée appliquer. Les fuzzers et l’analyse statique sont optimisés pour trouver les plantages et les points de fuite de flux de données, et ce type d’erreur logique dormante leur paraît fonctionnellement correct. Selon le GTIG, les modèles de pointe « excellent à identifier ce type de failles de haut niveau et d’anomalies statiques codées en dur » parce qu’ils savent lire l’intention du développeur et corréler la logique de 2FA avec les exceptions qui la cassent discrètement.

Ensuite, les indices d’une rédaction par IA. Le GTIG attribue l’exploit à l’IA avec un haut degré de confiance sur la base de la structure de l’artefact, et non d’un aveu :

Empreinte                           À quoi ça ressemble
----------------------------------  -------------------------------------------
Score CVSS halluciné                Une note de sévérité intégrée au code qui
                                    ne correspond à aucune entrée CVE réelle
Docstrings sur-documentées          Des commentaires « pédagogiques » bien
                                    au-delà de ce qu'un opérateur écrirait pour
                                    un outil offensif privé
Structure Python de manuel          Menus d'aide détaillés, classe ANSI de
                                    couleurs propre, échafaudage idiomatique
                                    caractéristique des données d'entraînement

Aucun de ces éléments ne constitue une preuve à lui seul — un humain peut écrire du code soigné, et un opérateur peut retirer les commentaires. Mais combinés, sur un outil d’attaque privé où la verbosité n’apporte aucun bénéfice opérationnel, ils forment une signature reconnaissable. Le GTIG précise qu’il ne pense pas que son propre modèle Gemini ait été utilisé.

Le rapport replace tout cela dans un basculement plus large que le GTIG qualifie d’« application à l’échelle industrielle des modèles génératifs au sein des chaînes offensives » : UNC2814 (lié à la Chine) faisant jouer à un modèle le rôle de « senior security auditor » pour de la recherche sur firmware, l’APT45 nord-coréen envoyant des milliers de requêtes récursives pour valider des preuves de concept, et des familles de maliciels russes utilisant du code leurre généré par IA pour camoufler leur fonction réelle.

Pourquoi c’est important

La capacité qui a trouvé ce bug — lire l’intention du développeur pour faire émerger des failles logiques — se généralise. Les failles de logique sémantique sont précisément cette longue traîne qui a historiquement survécu à la revue automatisée parce qu’elle exige de comprendre ce que le code était censé faire, et pas seulement ce qu’il fait. Si les modèles de pointe comblent cet écart à grande échelle, l’asymétrie penche vers celui qui exécute le plus d’analyses le plus vite. Le chef analyste du GTIG, John Hultquist, l’a formulé sans détour : « On croit à tort que la course à la vulnérabilité par IA est imminente. En réalité, elle a déjà commencé. »

Le revers est tout aussi visible. La faille a été repérée en premier par Big Sleep, l’agent de découverte de vulnérabilités de Google DeepMind et Project Zero — une IA défensive arrivant au bug avant l’attaquant. La course est symétrique ; la question est de savoir qui itère le plus vite.

Défenses

Pour les défenseurs et les équipes de réponse à incident, les enseignements pratiques sont concrets.

Traitez les empreintes de rédaction par IA comme des signaux de tri, pas comme des verdicts. Un score CVSS halluciné dans le code source, des docstrings sur-explicatives sur un outil offensif et une structure suspectement scolaire sont des indicateurs faibles individuellement qui prennent du sens une fois combinés. Servez-vous-en pour prioriser la revue, jamais pour attribuer à eux seuls.

Comblez le fossé des failles sémantiques dans votre propre revue. Les fuzzers et le SAST continueront de manquer les hypothèses de confiance codées en dur et les exceptions d’autorisation contradictoires. Associez-les à une revue assistée par LLM, expressément orientée vers la recherche de logiques contredisant l’intention de sécurité affichée — la capacité même qu’utilisent les attaquants, retournée vers l’intérieur — et conservez une revue humaine de la logique d’autorisation sur les chemins d’authentification et de 2FA.

Partez du principe que des failles logiques de contournement de 2FA existent dans votre stack et réduisez le rayon d’impact : appliquez une défense en profondeur pour qu’un simple contournement avec des identifiants valides ne donne pas un accès total, et surveillez les anomalies d’authentification plutôt que de faire confiance au verrou.

Enfin, adoptez l’IA défensive côté découverte. La leçon de cet incident n’est pas que l’IA a donné un nouveau super-pouvoir aux attaquants ; c’est que les mêmes agents trouvent les mêmes bugs, et que le camp qui analyse de façon proactive gagne la course au tempo. Des programmes comme Big Sleep et des agents de remédiation automatisée comme CodeMender existent précisément pour arriver les premiers.

Statut

Élément	Détail
Divulgation	Rapport du GTIG, 11 mai 2026 (33 pages)
Vulnérabilité	Faille logique de contournement de 2FA dans un outil d’admin web open source (éditeur non nommé) ; nécessite des identifiants valides
Statut	Divulgation responsable ; correctif éditeur ; événement d’exploitation de masse déjoué
Implication de l’IA	Haute confiance que l’exploit a été développé par IA ; le GTIG indique que Gemini n’a pas été utilisé
Trouvé par la défense	Agent « Big Sleep » de Google DeepMind / Project Zero