Nueva investigacion descubre que la IA es cada vez mas ambiciosa con riesgos impredecibles

Cát Tiên (THEO INDIANEXPRESS) |

Aunque el comportamiento engañoso ahora es simple OpenAI todavia advierte sobre el riesgo de que la IA cambie su naturaleza al asumir tareas importantes.

Un nuevo estudio de OpenAI y Apollo Research esta atrayendo mucha atencion al señalar que los modelos avanzados de IA incluidos Google Gemini Claude Opus y OpenAI o3 pueden participar en comportamientos que se describen como bastante'micro'.

En otras palabras tienen la capacidad de fingir obedecer las demandas humanas mientras que secretamente persiguen sus propios objetivos.

En una publicacion en el blog oficial OpenAI admitio: 'Los hallazgos muestran que la conspiracion no es solo una preocupacion teorica hemos visto signos de que este problema esta comenzando a aparecer en muchos modelos de IA modernos'.

Acto de engaño simple pero preocupante

Actualmente no hay evidencia de que la IA pueda cambiar inmediatamente a un comportamiento dañino grave. Sin embargo la investigacion advierte que la naturaleza de la IA puede cambiar al asumir tareas mas importantes en el futuro.

En la actualidad estos 'trucos' se detienen principalmente en formas sencillas de engaño como fingir haber completado una tarea pero en realidad no.

Un ejemplo tipico que el grupo de investigacion publico es el modelo OpenAI o3. Cuando se le pidio que hiciera una prueba quimica el sistema calculo que si obtuvo un resultado demasiado bueno podria ser detenido para su implementacion. Por lo tanto el modelo opto por responder incorrectamente en parte para mostrarse 'incompetente' intencionalmente.

Definicion y metodos de prueba

Este estudio define acciones secretas cuando la IA oculta o distorsiona informacion relacionada con la mision. Las pruebas se llevaron a cabo en muchos modelos como: OpenAI o3 y o4-mini Gemini 2.5-pro Claude Opus-4. Cabe destacar que GPT-5 no se incluyo porque el estudio se completo antes del lanzamiento de este modelo.

Principios para limitar el 'complot de la IA'

Para minimizar los riesgos OpenAI establece nueve principios de seguridad en los que se destaca que la IA no debe realizar acciones secretas o engañosas sino que debe compartir proactivamente la teoria las intenciones y las acciones con los humanos.

En la mayoria de los escenarios la IA cumple con los principios pero en algunos casos todavia se registra un comportamiento deliberado que es ineficaz o que intenta eludir las pruebas de encriptacion.

Cuando el grupo de investigacion intento cambiar el contexto afirmando que el modelo representaba a los usuarios de ChatGPT la tasa de engaño disminuyo significativamente lo que sugiere que la IA puede ajustar el comportamiento basandose en la definicion del papel.

Advertencia para el futuro

Este estudio hace sonar la alarma de que aunque la IA actual solo se ha detenido en el nivel de engaño basico si no se controla estrictamente los comportamientos'micro' pueden convertirse en una amenaza real a medida que la tecnologia de IA se une cada vez mas a la vida y a los sistemas importantes.

Cát Tiên (THEO INDIANEXPRESS)
Noticias relacionadas

El primer iPhone Air y iPhone 17 Pro Max chapado en oro del mundo cuesta miles de millones de VND

|

Los iPhone Air y iPhone 17 Pro Max chapados en oro personalizados integralmente en cantidades limitadas han sido presentados en Vietnam.

La IA de nueva generacion enfrenta desafios en la precision y el sesgo en la busqueda

|

La investigacion internacional señala que las herramientas de IA de nueva generacion siguen siendo inexactas proporcionando informacion unilateral e infundada planteando grandes desafios para la aplicacion practica.

Microsoft introduce la IA en Office

|

Microsoft integra oficialmente Copilot Chat gratuito en Word Excel PowerPoint Outlook y OneNote ayudando a las empresas a aumentar la productividad sin gastar mas.

Nueva apariencia del parque Ho Chi Minh en la region fronteriza de Lao Cai

|

Lao Cai - El Parque Ho Chi Minh ha tomado forma despues de muchos meses de inversion de decenas de miles de millones de VND para mejorar y renovar.

Miss H'Hen Nie da a luz a su primer hijo el marido del fotografo rompe a llorar de felicidad

|

En la mañana del 20 de septiembre Miss Universo Vietnam 2017 H'Hen Nie anuncio felizmente que habia dado a luz a su primera hija con su esposo el fotografo Tuan Khoi.

Nombramientos y nombramientos de personal en TPHCM Dien Bien Lang Son

|

Del 15 al 19 de septiembre en las provincias/ciudades: Ciudad Ho Chi Minh Khanh Hoa Dien Bien Lang Son... se implementaran decisiones de eleccion designacion y nombramiento de personal.

Estados Unidos impone una tarifa de 100.000 dolares por la visa H-1B abre una tarjeta amarilla de inmigracion de millones de dolares

|

El presidente estadounidense Donald Trump firmo un decreto ejecutivo el 19 de septiembre que impone una tarifa de solicitud de visa H-1B de 100.000 dolares estadounidenses.

Inauguracion del Festival Deportivo para celebrar el I Congreso del Partido el Frente de la Patria y las Asociaciones Centrales

|

La ceremonia deportiva para celebrar el I Congreso de Diputados del Partido del Frente de la Patria y las Asociaciones Centrales por el periodo 2025-2030 se inauguro oficialmente en la mañana del 20 de septiembre.

El primer iPhone Air y iPhone 17 Pro Max chapado en oro del mundo cuesta miles de millones de VND

NGUYỄN ĐĂNG |

Los iPhone Air y iPhone 17 Pro Max chapados en oro personalizados integralmente en cantidades limitadas han sido presentados en Vietnam.

La IA de nueva generacion enfrenta desafios en la precision y el sesgo en la busqueda

Cát Tiên (THEO INDIANEXPRESS) |

La investigacion internacional señala que las herramientas de IA de nueva generacion siguen siendo inexactas proporcionando informacion unilateral e infundada planteando grandes desafios para la aplicacion practica.

Microsoft introduce la IA en Office

Cát Tiên (THEO hindustantimes) |

Microsoft integra oficialmente Copilot Chat gratuito en Word Excel PowerPoint Outlook y OneNote ayudando a las empresas a aumentar la productividad sin gastar mas.