Razones por las que a la inteligencia artificial AI le gusta predecir en lugar de admitir no saber

Cát Tiên (THEO techcrunch) |

La IA sigue siendo un gran desafio. OpenAI propone cambiar el mecanismo de evaluacion castigar severamente las faltas y fomentar el modelo de reconocimiento incierto.

Un nuevo estudio de OpenAI acaba de plantear una pregunta espinosa: '¿Por que los modelos de lenguajes grandes (LLM) como GPT-5 o chatbot ChatGPT todavia crean alucinaciones debido a la informacion que suena razonable pero es erronea? Y lo que es mas importante ¿que se puede hacer para minimizar este fenomeno?

En una publicacion de blog resumiendo la investigacion OpenAI reconoce que la alucinacion es un desafio fundamental de todos los modelos lingüisticos dificil de eliminar por completo.

Para ilustrar este argumento los investigadores examinaron a un chatbot popular sobre la tesis doctoral de Adam Tauman Kalai (autor del estudio).

Como resultado el sistema dio tres respuestas diferentes y todas fueron incorrectas. Incluso cuando se le pregunto su fecha de nacimiento la respuesta seguia siendo incorrecta.

Segun los investigadores este fenomeno se origino en el metodo de entrenamiento inicial. El modelo lingüistico aprende principalmente a predecir las siguientes palabras en la cadena de texto en lugar de etiquetar correctamente o incorrectamente cada dato.

Los detalles comunes como la ortografia los signos de pesca se pueden aprender facilmente con precision gracias a las leyes constantes. Por el contrario la informacion escasa y la frecuencia baja como la fecha de nacimiento de un individuo dificulta que el modelo predice con precision lo que lleva a la alucinacion.

Un punto notable es que la investigacion no señala que la fase de entrenamiento sea la causa principal sino que enfatiza mas la forma en que se evalua el modelo.

Actualmente la mayoria del sistema esta calificado por el numero de respuestas correctas absolutas creando involuntariamente un modelo que se fomenta la especulacion en lugar de admitir que no lo sabe.

Los autores comparan este mecanismo con un examen de opcion multiple como el hecho de que los candidatos que adivinan vagamente todavia tienen la oportunidad de obtener puntos mientras que los que estan vacios definitivamente pierden puntos. Del mismo modo cuando la IA solo se evalua basandose en la precision absoluta el sistema tendera a 'adivinar para que suene razonable' en lugar de admitir que no es seguro.

La solucion propuesta es cambiar la forma de puntuar al igual que el examen SAT tiene puntos negativos para las respuestas incorrectas.

Con la IA esto significa castigar severamente las respuestas seguras pero incorrectas mientras que solo castigar levemente o incluso recompensar parcialmente las respuestas que expresan incertidumbre.

Mientras la tabla de notas siga recompensando las predicciones de la suerte el modelo seguira aprendiendo a predecir' concluyo el grupo de investigacion.

Este estudio no solo aclara la causa profunda de la 'psicologia de la IA' sino que tambien abre una direccion para cambiar el mecanismo de evaluacion para alentar al modelo a reconocer sus limites en lugar de confiar en las respuestas equivocadas.

Cát Tiên (THEO techcrunch)
Noticias relacionadas

Koah recauda 5 millones de dolares para probar publicidad en una aplicacion de IA

|

Koah una startup con sede en San Francisco (EE. UU.) acaba de recaudar 5 millones de dolares en semillas con la creencia de que el cambio de publicidad en la aplicacion de IA sera efectivo.

Deepfake medico crea medicos de IA falsos y el riesgo de que los pacientes sean estafados para comprar suplementos dieteticos

|

Medicos reales son falsificados con tecnologia de IA para examinar y vender suplementos de mala calidad sembrando informacion erronea y causando peligro para la salud publica.

Startup de IA respaldada por Amazon quiere recrear la pelicula perdida de Orson Welles

|

Fable la empresa autoproclamada 'Netflix de la IA' acaba de anunciar un proyecto para recrear los 43 minutos perdidos en la pelicula The Magnificent Ambersons (1942).

Luces gigantes de la luna de miel de cientos de millones de VND brillantes en la ciudad de Tuyen Quang

|

Tuyen Quang - El festival de Trung thu en Tuyen Quang es famoso por sus enormes linternas.

No permitir la congestion de proyectos electricos debido a los retrasos en los tramites administrativos

|

El Viceprimer Ministro solicito a 3 corporaciones y 1 empresa militar que implementen resueltamente el proyecto electrico y no permitan la congestion del proyecto electrico debido a los retrasos en los procedimientos administrativos.

El marido se va a trabajar lejos la esposa en casa es infiel y tiene hijos con otra persona - Parte 1

|

Hora 9 - El marido expatriado se va a trabajar lejos y envia dinero para mantener a su familia. Pero en la soledad la esposa es infiel y esta embarazada de otra persona. ¿Como sera esta familia?

Vietnam continua contribuyendo a la paz en la frontera entre Tailandia y Camboya

|

Vietnam da la bienvenida a los desarrollos positivos entre Camboya y Tailandia y continuara esforzandose por contribuir a la paz en las fronteras de los dos paises.

La Confederacion General del Trabajo de Vietnam guia sobre la recaudacion de fondos sindicales

|

Los sindicatos de base utilizan el 75% de la recaudacion total de fondos sindicales de acuerdo con el documento de orientacion de la Confederacion General del Trabajo de Vietnam.

Koah recauda 5 millones de dolares para probar publicidad en una aplicacion de IA

HẠO THIÊN (THEO techcrunch) |

Koah una startup con sede en San Francisco (EE. UU.) acaba de recaudar 5 millones de dolares en semillas con la creencia de que el cambio de publicidad en la aplicacion de IA sera efectivo.

Deepfake medico crea medicos de IA falsos y el riesgo de que los pacientes sean estafados para comprar suplementos dieteticos

Cát Tiên (THEO INDIANEXPRESS) |

Medicos reales son falsificados con tecnologia de IA para examinar y vender suplementos de mala calidad sembrando informacion erronea y causando peligro para la salud publica.

Startup de IA respaldada por Amazon quiere recrear la pelicula perdida de Orson Welles

HẠO THIÊN (theo techcrunch) |

Fable la empresa autoproclamada 'Netflix de la IA' acaba de anunciar un proyecto para recrear los 43 minutos perdidos en la pelicula The Magnificent Ambersons (1942).