Un nuevo estudio de científicos vinculados a la Universidad de Cornell y la Universidad de California, Los Ángeles, está generando una gran preocupación en la comunidad académica al descubrir que casi 150.000 citas falsas creadas por inteligencia artificial (IA) han aparecido en artículos de investigación científica.
Según el estudio, se han descubierto alrededor de 146.900 referencias falsas en más de 2,5 millones de artículos científicos almacenados en cuatro grandes bases de datos de investigación, incluyendo arXiv, bioRxiv, SSRN y PubMed Central.
Los investigadores creen que la causa principal proviene del hecho de que muchos autores utilizan chatbots de IA como ChatGPT o Gemini para ayudar a escribir artículos pero no verifican la fuente del documento.
Los modelos lingüísticos grandes (LLM) actuales tienen la capacidad de crear textos muy convincentes, pero también existen graves limitaciones llamadas "ilusiones de IA", que son fenómenos de sistemas que crean información que suena razonable pero es completamente falsa.
En el entorno académico, esto es particularmente peligroso porque los artículos científicos siempre se basan en la precisión y la autenticidad de los materiales de referencia.
El equipo de investigación analizó alrededor de 111 millones de citas en la base de datos científica para encontrar materiales que no se pueden comparar con ninguna publicación real existente.
Aunque parte del error se debió a errores de mecanografía o confusión de información, el equipo de investigación aún determinó que la gran cantidad de citas creadas completamente por la IA no eran reales.
En particular, los investigadores dijeron que el número de referencias no existentes ha aumentado considerablemente desde 2023, cuando los chatbots de IA se hicieron populares en todo el mundo.
Esto muestra que muchos científicos o estudiantes de investigación dependen demasiado de las herramientas de IA en el proceso de redacción de artículos.
Según el grupo de autores, las citas falsas no solo aparecen en algunos estudios individuales, sino que se distribuyen en muchos artículos diferentes.
Esto se considera una señal de que el problema se ha extendido a la comunidad académica.
Usha Haley, profesora de gestión en la Universidad Estatal de Wichita (EE. UU.), opina que el aumento de las citas falsas es una seria advertencia para la ciencia moderna.
La Sra. Haley cree que los materiales de referencia creados por la IA están debilitando la base de la creencia del mundo académico, que depende del proceso de crítica de pares y la acumulación de conocimiento a través de muchas generaciones de investigación.
Lo preocupante es que este escepticismo ahora proviene del interior de la comunidad académica", dijo Haley.
Archivos científicos como arXiv o bioRxiv juegan un papel muy importante en el mundo de la investigación. Antes de ser publicados en revistas oficiales, muchos trabajos a menudo se publican previamente en estas plataformas para que la comunidad científica mundial los acceda y refute.
Ante el riesgo de que la IA "contamine" los datos académicos, arXiv anunció recientemente que prohibirá los trabajos de investigación que contengan citas inventadas o signos de contenido de IA no verificado.
Steinn Sigurdsson, director científico de arXiv, advierte que el tesoro del conocimiento científico se está diluyendo por la investigación de mala calidad o errónea creada por la IA.
Según Steinn Sigurdsson, esta situación no solo dificulta la búsqueda de información precisa, sino que también corre el riesgo de llevar a los investigadores en la dirección equivocada en el futuro.