Un nuevo estudio de la Facultad de Medicina de Harvard y el Centro Médico Beth Israel Deaconess está atrayendo la atención al demostrar que la inteligencia artificial (IA) puede hacer diagnósticos en la sala de emergencias con mayor precisión que los médicos en algunos casos.
El trabajo fue publicado en la revista Science, realizado por un grupo de médicos y científicos informáticos, con el objetivo de evaluar la eficacia de los grandes modelos lingüísticos en muchos contextos médicos, incluidas las situaciones de emergencia reales.
Los investigadores compararon la capacidad de diagnóstico de los dos internistas con los modelos de IA de OpenAI, incluyendo "o1 y 4o".
En un experimento notable, el equipo de investigación analizó datos de 76 pacientes que acudieron a la sala de emergencias de Beth Israel (un sistema hospitalario en Estados Unidos).
Los diagnósticos de los médicos y la IA son evaluados independientemente por otros dos médicos, en condiciones en las que no saben si los resultados son dados por la IA o los humanos.
Los resultados mostraron que el modelo o1 alcanzó una precisión o cercanía del 67% en la clasificación inicial, superior al 55% y al 50% de los dos médicos participantes.
En particular, la IA muestra una clara ventaja en la etapa inicial de clasificación, que es el momento en que los médicos tienen menos información pero tienen que tomar decisiones rápidas.
El equipo de investigación dijo que, en cada paso del diagnóstico, el modelo o1 siempre da resultados iguales o superiores a los de los médicos y los modelos de IA de generaciones anteriores.
Al mismo tiempo, el grupo de investigación también enfatizó que la IA no se "procesa de antemano los datos" sino que solo utiliza la información disponible en los registros médicos electrónicos en el momento del diagnóstico, de manera similar a los médicos.
Esto muestra el potencial de la IA para ayudar a tomar decisiones en entornos de alta presión como las salas de emergencias.
Sin embargo, el grupo de investigación también afirmó que este resultado no significa que la IA esté lista para reemplazar a los médicos en las decisiones de supervivencia. El grupo de investigación también pidió que se realicen más pruebas de precuración en el entorno real para evaluar plenamente la eficacia y la seguridad de esta tecnología.
Otra limitación señalada es que la investigación solo evalúa la IA basándose en datos de texto. Mientras tanto, la realidad clínica también incluye muchos otros factores como imágenes médicas, signos vitales y observaciones directas, que son áreas donde la IA todavía está limitada.
Los expertos también advierten sobre la exageración de los resultados. El Dr. Adam Rodman (participó en el estudio y es médico internista en el Centro Médico Beth Israel Deaconess) dijo que actualmente no existe un marco legal claro para determinar la responsabilidad cuando la IA hace un diagnóstico erróneo.
Mientras tanto, la médico de urgencias Kristen Panthagani opina que comparar la IA con un médico internista en lugar de un médico de urgencias puede no reflejar la realidad.
Porque, en un entorno de emergencia, el objetivo principal de los médicos no es hacer un diagnóstico final de inmediato, sino identificar rápidamente las situaciones peligrosas para la vida para manejarlas a tiempo.
En general, la investigación abre grandes perspectivas para la aplicación de la IA en la medicina, especialmente en el apoyo a los médicos para tomar decisiones rápidas. Sin embargo, para convertirse en una herramienta confiable en la práctica, la IA todavía necesita superar muchos desafíos técnicos, legales y éticos.