Qué aporta este artículo sobre LLM?

Anthropic publicó los primeros resultados de Project Glasswing: Claude Mythos Preview encontró más de 10.000 vulnerabilidades críticas en software estratégico en solo un mes.

Para quién es útil esta lectura?

Para lectores que quieren entender modelos con una explicación técnica pero directa, sin depender de hype ni de una demo cerrada.

Cómo se generó esta capa de lectura?

Se generó en build-time a partir del texto del post, sus etiquetas y reglas editoriales locales; no llama a un modelo cuando visitas la página.

Claude Mythos y Glasswing: 10.000 CVEs en un mes

Anthropic publicó el 22 de mayo de 2026 los primeros resultados de Project Glasswing, su programa de ciberseguridad basado en Claude Mythos Preview. El balance de un mes de operación con unos cincuenta socios seleccionados: más de 10.000 vulnerabilidades de severidad alta o crítica identificadas en software considerado estratégico para internet, empresas e infraestructuras esenciales. Es la primera validación a escala real de lo que un modelo especializado en ciberseguridad puede hacer cuando se le da acceso a bases de código reales.

Si no estás familiarizado con el modelo, el post anterior sobre Mythos y el incidente del sandbox describe los antecedentes y las capacidades que lo diferencian del resto de la familia Claude.

¿Qué es Project Glasswing?

Project Glasswing es la iniciativa de Anthropic para desplegar Mythos Preview en entornos de producción reales, bajo acceso controlado, con el objetivo explícito de mejorar la seguridad del software más crítico de internet antes de que esas vulnerabilidades sean explotadas por actores maliciosos.

El programa funciona así: organizaciones seleccionadas reciben acceso a Mythos Preview, lo aplican sobre sus sistemas o sobre código abierto relevante, y reportan los hallazgos siguiendo protocolos de divulgación responsable. Anthropic actúa como coordinador, consolida los resultados y actualiza a reguladores y stakeholders del sector.

La última actualización modificó también la política inicial del programa: los socios de Glasswing ahora pueden compartir hallazgos, herramientas y mejores prácticas con terceros, algo que estaba restringido en la versión original. El cambio responde a la presión de organizaciones que necesitan escalar la respuesta más rápido de lo que permite el acceso directo de cada socio.

Los números: qué encontró Mythos en un mes

Los datos publicados por Anthropic en la actualización de mayo son concretos y verificables:

Más de 10.000 vulnerabilidades de severidad alta o crítica identificadas colectivamente por los socios del programa
Escaneo de código abierto independiente: 23.019 hallazgos totales en más de 1.000 proyectos open source, con una estimación de 6.202 de severidad alta o crítica
Tasa de verdaderos positivos: del subconjunto de 1.752 casos revisados por firmas de seguridad independientes, el 90,6% resultaron ser positivos reales; el 62,4% fueron confirmados como alta o crítica severidad
Velocidad de parcheo: la media para resolver una vulnerabilidad crítica descubierta por Mythos Preview es de dos semanas

Esa tasa de falsos positivos —menos del 10% tras revisión independiente— es una métrica operativamente relevante. Reduce drásticamente el coste de triaje humano, que es el cuello de botella real del proceso.

Casos concretos: Firefox, Cloudflare y un bug de 27 años

Los resultados más citados en la cobertura del programa ilustran bien la escala y el tipo de hallazgos:

Mozilla y Firefox 150: Mythos Preview identificó 271 vulnerabilidades en Firefox 150 y desarrolló exploits funcionales para 181 de ellas. El dato comparativo es el más llamativo: en Firefox 148, Claude Opus 4.6 había encontrado un número diez veces menor. No es solo un salto cuantitativo — es el tipo de vulnerabilidades que cambia: Mythos identifica fallos de lógica, no solo patrones sintácticos conocidos.

Cloudflare: 2.000 bugs identificados en sus sistemas críticos, 400 de ellos de severidad alta o crítica. El equipo de seguridad de Cloudflare reportó una tasa de falsos positivos menor que la de sus propios testers humanos.

Vulnerabilidades históricas: el bug más antiguo confirmado hasta ahora tenía 27 años y vivía en OpenBSD, un sistema operativo diseñado específicamente para la seguridad. También se encontró un error de 16 años en FFmpeg, la librería de procesamiento de audio y vídeo usada en prácticamente cualquier sistema que reproduzca o transcodifique media. Ambos están parcheados.

El problema real: parchear no escala como encontrar

La implicación más importante de los resultados de Glasswing no es el número de vulnerabilidades encontradas. Es lo que ese número revela sobre el proceso de seguridad.

Durante décadas, el cuello de botella de la ciberseguridad ofensiva ha sido encontrar los fallos. Los equipos de red team son pequeños, el código es vasto y los bugs más profundos requieren semanas de análisis manual. Ese equilibrio entre ataque y defensa asumía implícitamente que encontrar era lento.

Mythos Preview rompe esa asunción. La velocidad de descubrimiento es ahora un orden de magnitud superior a la velocidad de verificación, comunicación y parcheo. Anthropic estima que, al ritmo actual, Mythos Preview habrá identificado cerca de 3.900 vulnerabilidades críticas solo en código abierto — sin contar lo encontrado para los socios directos del programa.

El resultado es una brecha creciente: la IA encuentra, los equipos humanos no pueden procesar al mismo ritmo. Las organizaciones que usan Mythos están acumulando una cola de vulnerabilidades confirmadas que no pueden parchear suficientemente rápido. Los actores que usen herramientas equivalentes con intenciones maliciosas explotan esa misma ventana.

Capacidades técnicas: qué puede hacer que antes era imposible

Más allá de los números, vale la pena entender qué tipo de vulnerabilidades detecta Mythos Preview que los sistemas anteriores no detectaban.

La diferencia principal es la capacidad para identificar fallos de lógica — bugs que no resultan de un error sintáctico ni de un patrón conocido en bases de datos de vulnerabilidades, sino de una brecha entre lo que el código hace y lo que la especificación o el modelo de seguridad requiere que haga. Este tipo de fallo no es detectable por análisis estático tradicional ni por fuzzing básico; requiere entender la intención del sistema.

Mythos Preview también puede, cuando se le indica explícitamente, desarrollar exploits funcionales para las vulnerabilidades que encuentra — no solo identificarlas. La capacidad de Mozilla de validar que 181 de los 271 bugs encontrados en Firefox eran explotables viene de que Mythos generó los propios exploits de prueba de concepto.

Acceso controlado y presión regulatoria

El acceso a Mythos Preview sigue siendo restringido. Los ~50 socios actuales incluyen empresas como Amazon, Microsoft, Nvidia y Apple. No incluyen la mayoría de los bancos centrales ni gobiernos, a pesar de que sus infraestructuras son objetivo prioritario de actores estatales.

Esa brecha de acceso ha generado presión regulatoria. Andrew Bailey, gobernador del Banco de Inglaterra, solicitó formalmente una reunión con Anthropic para discutir los hallazgos de Mythos. Anthropic accedió a reunirse con miembros del Financial Stability Board, el organismo que coordina la regulación financiera global.

Es un patrón que se repite en la historia de las tecnologías de doble uso: la capacidad ofensiva se despliega antes de que los marcos regulatorios tengan forma. La diferencia aquí es que Anthropic está siendo transparente sobre lo que el modelo puede hacer, lo que abre el debate sobre distribución antes de que la tecnología sea ampliamente accesible.

¿Por qué esto importa más allá de los titulares?

Los 10.000 bugs en un mes es el número que acapara titulares, pero la historia más relevante es estructural.

Los modelos de lenguaje como Claude o GPT ya habían demostrado utilidad en ciberseguridad: búsqueda de patrones, análisis de logs, asistencia en triaje. Eso es automatización de tareas que antes hacían humanos. Mythos representa algo diferente: capacidad de razonamiento sobre sistemas complejos que supera consistentemente a equipos expertos en métricas clave como tasa de detección y falsos positivos.

La diferencia práctica es la que separa a una herramienta de asistencia de un sistema que cambia el equilibrio entre atacante y defensor. Si los modelos con estas capacidades llegan a estar ampliamente disponibles sin los controles adecuados — el riesgo que Glasswing intenta gestionar preventivamente — el cuello de botella del ataque ya no será encontrar los bugs, sino tener tiempo para explotarlos antes de que sean parcheados.

Anthropic está apostando a que el mismo modelo que acelera el descubrimiento puede también acelerar la defensa. Project Glasswing es la prueba de concepto de esa apuesta. Los primeros resultados son consistentes con la hipótesis, pero la escala del problema — millones de líneas de código en infraestructura crítica que llevan décadas sin revisión profunda — es suficientemente grande para que los resultados de un mes sean solo el inicio del problema, no la solución.

Para entender cómo Anthropic gestiona la autonomía de sus modelos más capaces en producción, el post sobre Claude Managed Agents describe la arquitectura de control y los mecanismos de aprobación humana que acompañan el despliegue de sistemas autónomos.

Sources:

Claude Mythos y Glasswing: 10.000 CVEs en un mes

¿Qué es Project Glasswing?

Los números: qué encontró Mythos en un mes

Casos concretos: Firefox, Cloudflare y un bug de 27 años

El problema real: parchear no escala como encontrar

Capacidades técnicas: qué puede hacer que antes era imposible

Acceso controlado y presión regulatoria

¿Por qué esto importa más allá de los titulares?

Más sobre Modelos

Conecta con

Capas de lectura IA

Resumen ejecutivo

Lectura técnica

Puntos clave

Glosario