Anthropic acaba de anunciar los primeros resultados del Proyecto Glasswing, un programa de investigación destinado a proteger el software importante del riesgo de que la IA explote vulnerabilidades de seguridad.
Según Anthropic, el modelo de IA de seguridad cibernética llamado Claude Mythos ha detectado más de 10.000 vulnerabilidades de software de alta gravedad o extremadamente graves en solo un mes.
Esta información está reforzando la opinión de que la IA ahora puede detectar errores de seguridad a una velocidad que supera con creces la capacidad de procesamiento y parcheo de errores de los humanos.
Según Anthropic, Claude Mythos es un modelo de IA no revelado, desarrollado específicamente para tareas de seguridad cibernética. En la fase de prueba, muchos socios que participaron en el proyecto registraron un fuerte aumento en el número de errores de seguridad detectados en comparación con antes.
Uno de los socios destacados es la empresa de tecnología Cloudflare. Esta empresa dijo que ha detectado alrededor de 2.000 errores en sistemas clave, de los cuales 400 errores se evaluaron como graves o altamente peligrosos.
El equipo técnico de Cloudflare evaluó que la tasa de falsas alarmas de Mythos es menor que muchos métodos de prueba manual tradicionales.
Mientras tanto, la organización tecnológica sin fines de lucro Mozilla dijo que había encontrado y solucionado 271 vulnerabilidades de seguridad en Firefox 150 al probar Mythos Preview. Esta cifra es aproximadamente 10 veces mayor que el número de errores que descubrieron en Firefox 148 utilizando el modelo Claude Opus 4.6 anterior.
En una prueba con un banco socio, se dice que este sistema ha interceptado con éxito una transacción fraudulenta de transferencia de dinero por valor de 1,5 millones de dólares en tiempo real.
Para los proyectos de código abierto, Anthropic dijo que han utilizado Mythos Preview para escanear más de 1.000 proyectos considerados la base de la mayor parte de Internet actual. A partir de estos proyectos, la IA ha detectado alrededor de 6,202 vulnerabilidades de alta gravedad o extremadamente graves.
Para verificar la precisión, Anthropic se coordinó con seis empresas de investigación de seguridad independientes para evaluar 1. 752 vulnerabilidades detectadas. Los resultados mostraron que alrededor del 90,6% eran advertencias precisas y el 62,4% fueron confirmadas como graves o extremadamente graves.
Sin embargo, la velocidad de detección de errores demasiado rápida de la IA también está creando una gran presión adicional para la comunidad de desarrollo de software.
Anthropic dijo que el proceso de manejo de la vulnerabilidad es actualmente bastante complejo. Después de que la IA detecta un error, los expertos deben verificar la autenticidad, evaluar el nivel de peligro, verificar el parche y enviar un informe detallado al equipo de desarrollo de software relevante.
Se dice que muchos proyectos de código abierto están sobrecargados por una gran cantidad de informes de errores creados por la IA. Algunos grupos de gestión de software incluso sugieren a Anthropic que reduzca la velocidad de envío de informes para tener tiempo suficiente para desarrollar e implementar parches de seguridad.
Según las estadísticas de la empresa, en promedio, cada vulnerabilidad grave requiere unas dos semanas para solucionarse.
Hasta la fecha, Anthropic ha informado de 530 vulnerabilidades graves, de las cuales solo 75 vulnerabilidades se han parcheado por completo y 65 vulnerabilidades han emitido advertencias de seguridad pública. Además, todavía hay otras 827 vulnerabilidades esperando ser publicadas.