OFFENSIVE AI
(15)15 hack(s).
1.000 registros de agentes capturados: un atacante poco cualificado vulneró 14 empresas con Claude y Codex
OALABS recuperó más de 1.000 sesiones de Claude Code y Codex dejadas por un atacante descuidado. En todas ellas, los modelos de frontera solo emitieron diez violaciones de política: la descualificación de la intrusión, documentada desde dentro.
El LLMjacking evoluciona: cómputo Ollama robado para agentes de ataque autónomos
Un informe de Sysdig del 17 de junio de 2026 documenta un incidente capturado: un servidor Ollama expuesto y sin autenticación usado como motor de razonamiento de una cadena ofensiva multietapa. La solución es operativa, no del modelo.
IA criminal como servicio en 2026: cómo el mercado clandestino operacionaliza el cibercrimen
Un informe de Rapid7 del 11 de junio de 2026 muestra que el mercado de la IA criminal pasó de los «chatbots maliciosos» a una capa de productividad: wrappers de jailbreak, cuentas robadas y servicios de deepfake para eludir el KYC.
Un agente LLM que pentesta Salesforce Experience Cloud de extremo a extremo
El 8 de junio de 2026, Reco publicó un agente que mapea, fuzzea y explota sitios de Salesforce Experience Cloud sin intervención humana — las mismas configuraciones erróneas que ShinyHunters explota desde 2025, ahora gobernadas por un modelo.
Cómo la IA agéntica comprime el ciclo de vida del ataque
Un artículo de arXiv de mayo de 2026 modela cómo la IA agéntica reduce el coste de cada etapa de un ataque —de la reconnaissance a la post-explotación— comprimiendo la kill chain y redefiniendo las prioridades defensivas.
VR de firmware manos libres: un agente LLM realiza ingeniería inversa de un intercomunicador OT de extremo a extremo
El 2 de junio de 2026, Claroty Team82 ejecutó Claude Opus 4.6 con un servidor MCP de Ghidra contra el firmware de un intercomunicador Zenitel y volvió a encontrar un conjunto de CVE conocidas en menos de diez minutos — un anticipo de la investigación de vulnerabilidades de firmware convertida en mercancía.
Gusanos de IA adaptativos: cuando el malware ejecuta su propio LLM local
Un paper de la Universidad de Toronto (junio de 2026) demuestra un gusano que ejecuta LLM open-weight en las máquinas que compromete, adapta su exploit a cada objetivo y arma advisories publicados tras la fecha de corte del modelo.
Actores maliciosos de IA mapeados en MITRE ATT&CK: el puntaje ARiES y lo que rompe
El informe de Anthropic del 3 de junio de 2026 mapea un año de ciberataques asistidos por IA en MITRE ATT&CK. La conclusión para los defensores: la sofisticación, el número de técnicas y la interfaz ya no predicen el riesgo — la orquestación sí.
CAESAR: agentes LLM coordinados superan el techo de razonamiento de un solo modelo
Un artículo de arXiv del 9 de mayo de 2026 muestra que dividir a un atacante LLM en cinco roles tipados supera a un agente único en 25 retos CTF y cuatro modelos — la ganancia viene de la estructura de coordinación, no de la capacidad bruta.
El agente al volante: detectar la post-explotación dirigida por un LLM
El 10 de mayo de 2026, Sysdig captó su primera intrusión en la que un agente LLM dirigía la post-explotación en tiempo real — de CVE-2026-39987 en marimo a un volcado completo de PostgreSQL en menos de una hora. La pista forense es la forma de los comandos.
Zero-days escritos por IA: cómo el GTIG identificó el primer exploit creado por un modelo
El 11 de mayo de 2026, el GTIG de Google reveló el primer zero-day que cree desarrollado con IA: un script de bypass de 2FA delatado por una puntuación CVSS alucinada y docstrings de manual. Así se leen esas señales.
El boletín de Apple de mayo de 2026 acredita formalmente a Claude en dos CVE de macOS
El 11 de mayo de 2026, el aviso de seguridad de Apple para macOS Tahoe 26.5 menciona a Claude junto a sus investigadores en dos CVE — un desbordamiento de enteros en el kernel y un use-after-free en WebKit. La investigación de vulnerabilidades asistida por IA ya está en el changelog oficial.
La primera ola de CVE: el descubrimiento asistido por IA reconfigura los volúmenes de divulgación
El análisis de VulnCheck del 14 de mayo de 2026 muestra una subida YTD de +563 % en Chrome, +476 % en GitHub, +180 % en VMware, +170 % en Apache. El giro sistémico tras los titulares de Apple, Mozilla y ActiveMQ ya es visible en las cifras.
Ataque ICS asistido por IA: lecciones de la intrusión contra la empresa de aguas de Monterrey
El informe publicado por Dragos en mayo de 2026 sobre Servicios de Agua y Drenaje de Monterrey documenta la primera campaña analizada públicamente en la que un LLM comercial — Claude — fue el operador técnico principal de un intento de intrusión OT.
OpenAI Daybreak y GPT-5.5-Cyber: un modelo de seguridad permisivo tras una verificación de identidad
Entre el 7 y el 12 de mayo de 2026, OpenAI lanzó Daybreak — una plataforma de ciberseguridad sobre GPT-5.5, Codex Security y un hermano «cyber-permisivo», GPT-5.5-Cyber. El red team de UK AISI ya había encontrado un jailbreak universal en seis horas.