El nuevo modelo de inteligencia artificial de Anthropic llamado Claude Mythos, aunque aún no se ha lanzado oficialmente, se ha convertido rápidamente en el centro de atención de la comunidad tecnológica.
La información filtrada muestra que esto podría ser un gran paso adelante en la carrera por desarrollar modelos lingüísticos a gran escala (LLM), al tiempo que genera muchas preocupaciones sobre los riesgos de seguridad cibernética.
Según documentos internos filtrados, Claude Mythos se describe como el modelo más probable que Anthropic haya construido jamás, superando incluso a la versión anterior Claude Opus 4. 6.
Esta información apareció después de que investigadores de seguridad descubrieran un borrador de blog no publicado colocado en una base de datos pública debido a un error de configuración del sistema.
Anthropic confirmó posteriormente el incidente, diciendo que la causa provenía de un "error humano". Sin embargo, el contenido filtrado también reveló muchos detalles importantes sobre la dirección de desarrollo de la IA de la empresa.
Se dice que Claude Mythos pertenece a la nueva línea de productos llamada Capybara, que es una generación de modelos diseñada más potente que la línea Opus anterior.
Si bien Anthropic actualmente mantiene tres niveles de modelo que incluyen Opus, Sonnet y Haiku, se espera que la línea Capybara establezca nuevos estándares de rendimiento, aunque los costos operativos sean significativamente más altos.
El punto más notable radica en la capacidad relacionada con la seguridad cibernética. Según la información filtrada, Mythos logró resultados sobresalientes en pruebas de programación, pensamiento académico y especialmente la capacidad de detectar y explotar vulnerabilidades de seguridad. Esto hizo que Anthropic admitiera los riesgos potenciales.
La empresa advierte que el modelo podría ser explotado por malos actores para llevar a cabo ciberataques a gran escala con un nivel de sofisticación más alto que antes.
Incluso, se dice que Mythos supera con creces a otros modelos de IA en capacidad de ciberseguridad, lo que plantea nuevos desafíos para los sistemas de defensa.
Por lo tanto, la estrategia de implementación de Anthropic se considera cautelosa. En lugar de lanzarlo ampliamente, la compañía actualmente solo proporciona acceso temprano a un pequeño grupo de usuarios, principalmente organizaciones y expertos en seguridad.
El objetivo es ayudarles a prepararse para la ola de ciberataques que podrían ser apoyados por la IA en un futuro próximo.
La aparición de Claude Mythos no es solo un avance tecnológico, sino también una advertencia sobre una nueva era de seguridad cibernética, donde la IA es a la vez una herramienta de protección y puede convertirse en una amenaza si no se controla estrictamente.
Actualmente, el momento del lanzamiento oficial de este modelo aún no se ha anunciado.