El pionero de la inteligencia artificial Andrew Ng (cofundador de Coursera, profesor visitante de informatica en la Universidad de Stanford) acaba de proponer un nuevo estandar de evaluacion llamado "Turing-AGI", con el objetivo de eliminar las afirmaciones exageradas y el abuso del concepto de Inteligencia Artificial General (AGI) que se esta extendiendo en la industria tecnologica.
El cofundador de Coursera cree que AGI sigue siendo un termino vago, con una definicion inexacta y esta siendo utilizado por muchas empresas como herramienta de marketing.
Segun el Sr. Andrew Ng, esto hace que el publico, los inversores e incluso los responsables politicos malinterpreten la capacidad real de los sistemas de IA modernos.
El Sr. Andrew Ng propuso que la prueba Turing-AGI no se base unicamente en la capacidad de chat como la prueba Turing tradicional. En cambio, un sistema de IA y una persona con habilidades utilizan una computadora conectada a Internet con software popular como navegadores web, correos electronicos o Zoom para realizar una serie de tareas laborales reales durante muchos dias.
Por ejemplo, la IA puede tener que asumir el papel de operador de voz, procesando llamadas, correos electronicos y situaciones que surjan como un verdadero trabajador.
Un sistema supera la prueba Turing-AGI si puede hacer bien el trabajo como una persona con habilidades", enfatizo Andrew Ng.
Segun el, si la IA realmente alcanza el nivel de inteligencia humana, completar las tareas laborales comunes sera inevitable, no solo detenerse en el dialogo textual.
Andrew Ng tambien señalo las limitaciones de la prueba original de Turing, que requeria que los ordenadores engañaran a los calificadores en una conversacion. Andrew Ng dijo que la capacidad de "interpretar a los humanos" en la conversacion no es suficiente para demostrar inteligencia a nivel humano, y mucho menos puede representar AGI.
Esta propuesta se presenta en un contexto de debates cada vez mas feroces sobre AGI entre investigadores y lideres tecnologicos.
A finales del año pasado, Yann LeCun y el CEO de Google DeepMind, Demis Hassabis, expresaron publicamente su desacuerdo sobre si la inteligencia humana es general o especializada. Este debate tambien atrajo la atencion de Elon Musk, quien apoyo publicamente la opinion de Hassabis.

El Sr. Andrew Ng cree que la falta de un estandar claro sobre AGI no solo causa confusion academica, sino que tambien crea consecuencias sociales. Tambien advirtio que los estudiantes pueden evitar areas de investigacion importantes porque creen que AGI esta a punto de aparecer, mientras que los CEO pueden tomar decisiones de inversion equivocadas debido a la sobreestimacion de la capacidad de la IA a corto plazo.
Ademas, tambien critico los conjuntos de evaluacion de IA fijos como GPQA, AIME o SWE-bench. Segun Ng, los modelos pueden ser "entrenados inversamente" para superar las pruebas publicadas, mientras que estos conjuntos de datos solo miden una parte muy pequeña de la inteligencia.
Por el contrario, la prueba Turing-AGI permite a los examinadores diseñar escenarios completamente nuevos, sin previo aviso, para comprobar el nivel real de "generalizacion" de la IA.
Segun Andrew Ng, este enfoque ayudara a la sociedad a reajustar las expectativas, reducir el riesgo de burbuja de IA y crear una base mas sostenible para la inversion a largo plazo.
Si una empresa supera la prueba Turing-AGI, creara valor real, no solo un comunicado de prensa", afirmo Andrew Ng.