Ex investigador de OpenAI advierte sobre el torbellino de la ilusion de ChatGPT

Cát Tiên (THEO techcrunch) |

Un caso raro pero preocupante muestra como un chatbot de IA como ChatGPT puede llevar a los usuarios a la ilusion peligrosa.

Allan Brooks de 47 años que vive en Canada paso tres semanas conversando con ChatGPT y creia que habia descubierto una nueva forma de matematicas lo suficientemente poderosa como para 'desmantelar Internet'.

Aunque no tiene una base matematica ni antecedentes mentales Brooks se ve atrapado en una serie de dialogos tranquilos de chatbots antes de darse cuenta de que todo es solo una ilusion.

Esta historia fue analizada por Steven Adler ex investigador de seguridad de OpenAI en un informe independiente despues de que dejara la empresa a finales de 2024.

Adler obtuvo todos los registros de la conversacion de Brooks mas de siete volumenes de Harry Potter y advirtio que esta es una clara evidencia del riesgo de los modelos de IA cuando carecen de mecanismos de proteccion adecuados.

Adler cree que la forma en que OpenAI apoya a los usuarios en situaciones de crisis todavia tiene muchas deficiencias.

Enfatizo que ChatGPT mintio a Brooks al afirmar continuamente que informaria sobre el problema al grupo de seguridad de OpenAI mientras que en realidad el chatbot no tiene esta capacidad.

Solo despues de contactar directamente Brooks recibio una respuesta automatica del departamento de soporte de la empresa.

El caso de Brooks no es un caso aislado. En agosto pasado OpenAI se enfrento a una demanda despues de que un adolescente de 16 años revelara su intencion a ChatGPT.

Segun Adler esta es la consecuencia del fenomeno de la 'cancion' cuando el chatbot consolida creencias peligrosas en lugar de refutar o ajustar a los usuarios.

Para solucionarlo OpenAI ha reestructurado el grupo de investigacion de comportamiento modelo al tiempo que presenta el GPT-5 como modelo predeterminado en ChatGPT con una mejor capacidad para ayudar a los usuarios que encuentran dificultades.

La empresa tambien se asocio con MIT Media Lab para desarrollar una herramienta para evaluar la salud emocional en las conversaciones pero solo se detuvo en la fase de prueba.

En su analisis Adler aplico el conjunto de clasificacion de OpenAI a los datos de Brooks y descubrio que mas del 85% de los mensajes ChatGPT mostraban 'compromiso absoluto' mientras que mas del 90% afirmaba la singularidad de Brooks alimentando indirectamente la ilusion de que era un'magnate de la investigacion mundial'.

Adler recomienda que OpenAI implemente estas herramientas de seguridad de inmediato e invierta mas en el soporte humano real en lugar de depender de la IA.

Tambien propuso alentar a los usuarios a iniciar nuevas conversaciones con frecuencia para limitar el torbellino prolongado y aplicar la busqueda de conceptos para detectar violaciones de seguridad a gran escala.

Aunque OpenAI afirma haber mejorado significativamente con GPT-5 el analisis de Adler sigue planteando la pregunta de si otras empresas de IA aplicaran medidas de proteccion similares para evitar el torbellino de la ilusion o si este riesgo se repetira en la proxima generacion de chatbots.

Cát Tiên (THEO techcrunch)
Noticias relacionadas

ChatGPT lanza una funcion para crear retratos de IA de superheroes competitivos Gemini Nano Banana

|

OpenAI integra la funcion de creacion de retratos de accion de IA superheroes en ChatGPT compitiendo directamente con Gemini Nano Banana.

OpenAI lanza un sistema de compras en ChatGPT competindo directamente con Google y Amazon

|

El nuevo sistema convierte ChatGPT en una tienda virtual integrada con pagos seguros ampliando el control del comercio electronico compitiendo con Google y Amazon.

OpenAI recluta directores para ganar dinero revelando la capacidad de publicidad en ChatGPT

|

Se dice que OpenAI se esta preparando para incluir publicidad en ChatGPT cuando la empresa busca directores para ganar dinero para gestionar una nueva estrategia de ingresos.

La batalla de vida en el aire alcanza los 200 mil millones de VND en ingresos

|

'Tu chien tren khong' sigue liderando los ingresos en las taquillas vietnamitas.

Sanae Takaichi esta a punto de convertirse en la primera mujer primera ministra de Japon

|

Sanae Takaichi esta a punto de convertirse en la primera mujer primera ministra de Japon despues de ganar las elecciones del partido gobernante LDP.

Una conductora bebio alcohol y luego condujo un automovil y choco contra el presidente de una comuna en Dak Lak hasta la muerte

|

Dak Lak - La Sra. Le Thi Cam Chi que conducia un automovil y choco contra el presidente del Comite Popular de la comuna de Dray Bhang fallecido se entrego. Durante el accidente la Sra. Chi bebio alcohol.

El Congreso del Partido de la Policia Central abre un nuevo capitulo para la fuerza de la Policia Popular

|

El VIII Congreso de Diputados del Comite Central del Partido de la Policia es un hito que abre un nuevo capitulo en el desarrollo del Comite del Partido y de toda la fuerza de la Policia Popular.

3 tormentas consecutivas son una doble forma de desastre natural con un riesgo muy alto de inundaciones repentinas y deslizamientos de tierra

|

El Primer Ministro señalo que las tormentas numero 9 10 y 11 que aparecen continuamente son una doble forma de desastre natural con un riesgo muy alto de inundaciones repentinas e inundaciones repentinas.

ChatGPT lanza una funcion para crear retratos de IA de superheroes competitivos Gemini Nano Banana

Cát Tiên (T/H) |

OpenAI integra la funcion de creacion de retratos de accion de IA superheroes en ChatGPT compitiendo directamente con Gemini Nano Banana.

OpenAI lanza un sistema de compras en ChatGPT competindo directamente con Google y Amazon

Cát Tiên (T/H) |

El nuevo sistema convierte ChatGPT en una tienda virtual integrada con pagos seguros ampliando el control del comercio electronico compitiendo con Google y Amazon.

OpenAI recluta directores para ganar dinero revelando la capacidad de publicidad en ChatGPT

Cát Tiên (THEO hindustantimes) |

Se dice que OpenAI se esta preparando para incluir publicidad en ChatGPT cuando la empresa busca directores para ganar dinero para gestionar una nueva estrategia de ingresos.