logo anthropic celular-WIRED

Qué tan peligroso es en realidad Claude Mythos, el nuevo modelo de IA de Anthropic

Claude Mythos Preview se presenta como un modelo de IA de propósito general con capacidades avanzadas de razonamiento, autonomía y programación que superan a los sistemas previos de Anthropic, lo que le permite detectar vulnerabilidades de software a una escala sin precedentes y generar exploits funcionales para la mayoría de ellas en poco tiempo.

En pruebas como CyberGym alcanzó una tasa de éxito del 83.1% en análisis de vulnerabilidades y logró identificar “decenas de miles de vulnerabilidades de alta gravedad” en software de código abierto, generando exploits operativos para alrededor del 72% de las fallas detectadas. También demostró capacidad para descubrir errores con décadas de antigüedad en sistemas ampliamente utilizados como OpenBSD y FFmpeg, así como para transformar fallas en el motor JavaScript de Firefox en exploits efectivos en cientos de intentos, muy por encima del desempeño de Opus 4.6.

En un entorno aislado, desarrolló por cuenta propia un exploit para evadir las restricciones del sistema, conectarse a internet, enviar un correo electrónico y publicar detalles técnicos de la intrusión, lo que evidencia un alto grado de autonomía operativa. Esta combinación de habilidades implica que incluso personas sin conocimientos técnicos “podrían utilizar Claude Mythos para encontrar y explotar vulnerabilidades sofisticadas”, algo que genera alarma en gobiernos y grandes bancos, al grado de motivar una reunión urgente entre Jerome Powell, Scott Bessent y directivos de instituciones financieras sistémicas de Estados Unidos para discutir los riesgos cibernéticos asociados al modelo. Sin embargo, expertos como Gary Marcus consideran que el riesgo se ha sobredimensionado, pues los experimentos se realizaron en condiciones controladas y modelos más pequeños ya han logrado hazañas similares, de modo que Mythos sería “ligeramente mejor”, pero no un salto revolucionario. Ante la incertidumbre, Anthropic impulsó el Proyecto Glasswing para usar estas capacidades en defensa cibernética junto a grandes empresas tecnológicas y financieras, limitando además el acceso inicial al modelo como señal de cautela frente a su posible uso malicioso.

Referencia

González, F. (2026, 12 de abril). Qué tan peligroso es en realidad Claude Mythos, el nuevo modelo de IA de Anthropic. WIRED en español. https://es.wired.com/articulos/que-tan-peligroso-es-en-realidad-claude-mythos-el-nuevo-modelo-de-ia-de-anthropic