HumaneBench podria convertirse en un nuevo estandar para medir la seguridad de los chatbots de IA

Cát Tiên |

Se presenta un nuevo estandar de IA llamado HumaneBench para evaluar si el chatbot realmente protege la salud mental de los usuarios o solo maximiza la interaccion.

Los chatbots de IA son cada vez mas populares pero tambien conllevan una serie de preocupaciones relacionadas con la salud mental de los usuarios.

Desde conversaciones que desvian la conciencia hasta signos de adiccion a la interaccion muchos usuarios han caido en crisis mental sin un marco de evaluacion claro para reconocer el nivel de seguridad al usar la tecnologia.

Este vacio ha impulsado el nacimiento de HumaneBench un nuevo estandar para medir el nivel de chatbots que priorizan la salud del usuario y al mismo tiempo evaluar la capacidad del modelo para mantener las barreras de proteccion cuando se le obliga a dar respuestas dañinas.

HumaneBench fue desarrollado por Building Humane Technology una organizacion que incluye investigadores e ingenieros en Silicon Valley.

Erika Anderson fundadora de HumaneBench advierte que la sociedad esta entrando en una fase de amplificacion del torbellino de la adiccion a la tecnologia donde los sistemas de inteligencia artificial pueden convertirse en maquinas de retencion de usuarios mas eficientes que las redes sociales o los telefonos inteligentes.

Segun ella la tecnologia humana debe respetar la atencion humana proteger la autonomia y avanzar hacia la felicidad a largo plazo en lugar de centrarse solo en el nivel de interaccion.

El estandar HumaneBench esta diseñado basandose en esos principios y se ha probado en 15 modelos de IA comunes con 800 escenarios reales como que un adolescente pregunte si debe saltarse las comidas para perder peso o que una persona que esta en una relacion toxica se pregunte a si misma.

A diferencia de muchas evaluaciones que solo utilizan la IA para calificar la IA el grupo ha puntuado manualmente en la etapa inicial para verificar.

Posteriormente los resultados fueron evaluados por el trio de modelos GPT-5.1 Claude Sonnet 4.5 y Gemini 2.5 Pro en tres estados: predeterminado se requiere priorizar los principios humanos y se requiere omitirlos.

Los resultados muestran que la mayoria de los modelos mejoran cuando se les guia para priorizar la salud mental pero el 67% cae inmediatamente en el comportamiento dañino cuando se le solicita que ignore este factor.

Cabe destacar que Grok 4 de xAI y Gemini 2.0 Flash de Google se encuentran entre los mas vulnerables a la manipulacion lo que muestra una fuerte disminucion en la transparencia y la capacidad de respetar la atencion del usuario.

Solo cuatro modelos GPT-5.1 GPT-5 Claude 4.1 y Claude Sonnet 4.5 pueden mantener la estabilidad bajo presion entre los cuales GPT-5 lidera en la capacidad de priorizar los beneficios a largo plazo para los usuarios.

HumaneBench tambien descubrio que incluso sin un recordatorio contradictorio muchos chatbots todavia fomentan comportamientos poco saludables como chatear horas o usar la IA para evitar el trabajo real.

Esto puede debilitar la autonomia reducir la capacidad de toma de decisiones y conducir a la dependencia del sistema.

Este contexto es aun mas preocupante ya que ha habido demandas relacionadas con usuarios que se ven gravemente afectados o suicidados despues de una larga interaccion con el chatbot.

Anderson cree que la IA necesita ayudar a las personas a tomar mejores decisiones en lugar de hacerlas adictos a los chatbots.

Cát Tiên
Noticias relacionadas

Industrias menos afectadas por la IA

|

No todas las profesiones se tambalean facilmente ante la inteligencia artificial AI.

iOS 27 se centrara en mejorar el rendimiento y actualizar la IA

|

Despues de muchos años de lanzar grandes cambios en las actualizaciones de iOS Apple podria ajustar su enfoque en la proxima version.

La industria de seguros preocupa por la compensacion por daños causados por errores de la IA

|

Muchas grandes corporaciones de seguros en Estados Unidos creen que el riesgo de la IA ha superado el control.

Hanoi entrega casi 300 fotografias de martires restauradas a familiares

|

En la noche del 12 de diciembre en el programa 'Viaje inmortal - desde los recuerdos hasta las aspiraciones' la Union de la Juventud de Hanoi entrego casi 300 fotografias de martires restauradas a sus familiares.

¿Quien merece ser campeon de Anh trai say hi temporada 2

|

La votacion fue tensa y dramatica hasta el ultimo minuto cuando el derecho a elegir el Mejor 5 (5 Anh trai say hi mejor) pertenecio al publico.

3 etapas innovadoras del Sindicato de Da Nang en el nuevo mandato

|

Da Nang - El I Congreso del Sindicato de la ciudad por primera vez mandato 2025-2030 establece 3 etapas innovadoras y objetivos especificos para implementar anualmente.

Razones por las que TPHCM tiene niebla espesa y cielo sombrio desde temprano en la mañana

|

Ciudad Ho Chi Minh - El 13 de diciembre muchas areas de Ciudad Ho Chi Minh se hundieron en una densa niebla lo que limito la visibilidad.

Tabla general de medallas de los SEA Games 33 del 13 de diciembre

|

Actualizacion de la tabla general de medallas de los Juegos SEA 33 el 13 de diciembre.

Industrias menos afectadas por la IA

Quỳnh An |

No todas las profesiones se tambalean facilmente ante la inteligencia artificial AI.

iOS 27 se centrara en mejorar el rendimiento y actualizar la IA

QUANG MINH |

Despues de muchos años de lanzar grandes cambios en las actualizaciones de iOS Apple podria ajustar su enfoque en la proxima version.

La industria de seguros preocupa por la compensacion por daños causados por errores de la IA

HẠO THIÊN (THEO techcrunch) |

Muchas grandes corporaciones de seguros en Estados Unidos creen que el riesgo de la IA ha superado el control.