OpenAI esta trabajando para mejorar su capacidad contra ataques ciberneticos para su navegador Atlas AI. Sin embargo tambien reconocen que los ataques de insercion de comandos (prompt injection) un tipo de ataque que manipula a los agentes de la IA para ejecutar directivas maliciosas que a menudo se ocultan en sitios web o correos electronicos es un riesgo que no desaparecera en poco tiempo lo que plantea interrogantes sobre el nivel de seguridad cuando los agentes de la IA operan en una red abierta.
El ataque de insercion de codigo malicioso al igual que las estafas y las tecnicas sociales en linea es dificil de resolver por completo' escribio OpenAI en una publicacion reciente en su blog detallando como la empresa esta mejorando la capacidad de defensa de Atlas para contrarrestar los ataques incesantes. La empresa reconoce que el'modo tactico' en ChatGPT Atlas 'amplia la superficie amenazante para la seguridad'.
Ademas de OpenAI el Centro Nacional de Seguridad de Redes del Reino Unido (NCSC) advirtio a principios de este mes que los ataques de insercion de codigo basados en recordatorios dirigidos a aplicaciones de inteligencia artificial biologica 'posiblemente nunca se minimizaran por completo' lo que hace que los sitios web corran el riesgo de convertirse en victimas de filtraciones de datos.
La agencia gubernamental britanica aconseja a los expertos en ciberseguridad que minimicen el riesgo y el impacto de los ataques de insercion de codigo basados en recordatorios en lugar de pensar que los ataques pueden ser 'prevenidos'.
Por parte de OpenAI la empresa dijo: 'Vemos la inyeccion de codigo instantanea como un desafio a largo plazo para la seguridad de la IA y necesitaremos fortalecer continuamente nuestras capacidades de defensa contra ella'.
¿Cual es la solucion de la empresa para esta tarea imposible? Un ciclo de respuesta rapida y proactiva que la empresa cree que esta mostrando signos positivos iniciales para ayudar a detectar nuevas estrategias de ataque internas antes de que sean explotadas en la practica.
OpenAI enfatiza que la prevencion de ataques de inyeccion de malware instantanea es muy dificil y completamente efectiva pero se estan basando en pruebas a gran escala y ciclos de parche mas rapidos para mejorar la seguridad del sistema antes de que aparezcan en ataques reales.
Un portavoz de OpenAI se nego a revelar si la actualizacion de seguridad de Atlas ha provocado una reduccion significativa en el numero de ataques exitosos de insercion de malware pero dijo que la compañia ha cooperado con terceros para mejorar la capacidad de contrarrestar los rapidos ataques de insercion de malware de Atlas desde antes de su lanzamiento.