PROMPT INJECTION

(9)

9 hack(s).

L'injection de prompt automatisée dépend du modèle : TAP devance GCG, GPT-5 résiste

Une étude de l'ETH Zurich du 9 juin 2026 adapte GCG et TAP à AgentDojo sur 80 paires de tâches d'agent. Le TAP en boîte noire bat le GCG par gradient, mais les attaques calibrées sur de petits modèles ne se transfèrent pas à GPT-5.

2026-06-25//6 min

PROMPT INJECTION MEDIUM NEW

Reprompt : exfiltration en un clic depuis Copilot Personal via prompt prérempli dans l'URL

Une faille corrigée de Copilot Personal enchaînait un prompt prérempli dans l'URL, un garde-fou qui ne vérifiait que la première requête, et des relances pilotées par serveur, pour une exfiltration furtive en un clic. Les leçons de contournement sont générales.

2026-06-17//6 min

PROMPT INJECTION MEDIUM NEW

Plugins de chatbot web : comment des widgets non sécurisés amplifient l'injection de prompt

Une étude IEEE S&P 2026 portant sur 17 plugins de chatbot répartis sur plus de 10 000 sites révèle des historiques de conversation falsifiables (injections 3 à 8x plus fortes) et des outils de scraping qui mélangent contenu de confiance et contenu non fiable.

2026-06-11//6 min

PROMPT INJECTION MEDIUM NEW

ASPI : demander une clarification élargit la surface d'injection

Un benchmark arXiv du 17 mai 2026 montre que lorsqu'un agent s'interrompt pour demander une précision à l'utilisateur, le taux de réussite des injections passe de moins de 2 % à plus de 34 % sur o3 et Gemini-3-Flash.

2026-06-03//6 min

PROMPT INJECTION MEDIUM NEW

Prompt injection dans la nature : attaques cachées dans le tri de CV par LLM

Une étude USENIX Security 2026 portant sur 196 682 CV réels révèle qu'environ 1 % contiennent des injections de prompt cachées — et plus de 90 % sont des « injections de données » invisibles, pas les instructions explicites que cherchent les détecteurs actuels.

2026-06-01//6 min

PROMPT INJECTION CRITICAL

Injection de prompt encodée : quand les garde-fous échouent parce que le LLM décode le payload

Le 4 mai 2026, un tweet rédigé en code Morse a vidé environ 175 000 $ d'un portefeuille crypto piloté par Grok. L'incident est la démonstration la plus coûteuse à ce jour d'un angle mort défensif déjà connu — un filtre par appariement de chaînes ne voit pas à travers les encodages que le modèle lui-même décode volontiers.

2026-05-27//8 min

PROMPT INJECTION MEDIUM

Injection par font-mapping : le peer review devient une surface d'attaque LLM

Un benchmark arXiv du 25 mai 2026 montre que des payloads dissimulés par font-mapping font passer des reviews LLM de reject à accept. ICML 2026 a déjà utilisé la même technique en miroir pour rejeter 497 articles.

2026-05-27//8 min

PROMPT INJECTION CRITICAL

Copirate 365 : chaîner injection de prompt, invocation différée d'outils et empoisonnement de mémoire dans M365 Copilot (CVE-2026-24299)

Le compte-rendu DEF CON de Johann Rehberger, publié en mai 2026, déroule une chaîne d'injection indirecte en cinq étapes qui transforme un courriel piégé en backdoor persistante dans Microsoft 365 Copilot. Patchée, mais les patterns sont génériques.

2026-05-25//8 min

PROMPT INJECTION CRITICAL

ASCII Smuggling : commandes cachées via les caractères Unicode Tag

Les caractères Unicode Tag (U+E0000–U+E007F) sont invisibles pour les humains mais interprétés par les LLM. Les attaquants les intègrent dans des emails, pages web et PDF pour injecter des commandes silencieuses qui détournent le comportement des agents.

2026-05-19//8 min