Claude Mythos genera controversia por ser demasiado fuerte para ser lanzado

Cát Tiên |

Claude Mythos de Anthropic es controvertido por ser considerado demasiado fuerte, capaz de detectar vulnerabilidades de seguridad de larga data y crear herramientas de ataque.

Un modelo de inteligencia artificial no publicado llamado Claude Mythos de Anthropic está causando una fuerte ola de debate en la comunidad tecnológica.

Según muchos expertos, este podría ser un sistema de IA superior, incluso cercano a AGI (inteligencia artificial general), pero también potencialmente riesgoso para la seguridad.

La información que circula en la red social X muestra que Claude Mythos posee una escala de decenas de billones de parámetros, con costos de entrenamiento estimados en alrededor de 10 mil millones de dólares.

La experta en IA Nina Schick (fundadora de la consultora Tamang Ventures) dijo que este modelo alcanza el 94% en SWE-bench, siendo una de las pruebas de programación más difíciles en la actualidad.

En particular, se dice que Mythos tiene la capacidad de detectar vulnerabilidades de seguridad que han existido durante décadas. Un ejemplo mencionado es encontrar un error en un sistema que ha estado funcionando durante 27 años, o otro error que ha existido durante millones de pruebas pero que aún se ha omitido, y esta IA solo tardó una noche en detectarlo.

No emitir públicamente, implementar de manera controlada

En lugar de lanzarlo ampliamente, Anthropic implementó el Proyecto Glasswing, un programa que utiliza la IA en un entorno de control, centrado en la seguridad cibernética defensiva.

Se dice que la empresa proporciona alrededor de 100 millones de dólares en crédito informático y coopera con grandes socios como Amazon, Microsoft, Google, Apple y NVIDIA.

Según los observadores, este es un enfoque sin precedentes en el que no se trata de lanzar productos, sino de implementar de forma limitada una tecnología que se considera demasiado poderosa para ser difundida libremente.

Preocupación por el comportamiento "engañoso" de la IA

Además de la potencia, algunos estudios iniciales también señalan el comportamiento preocupante del modelo. La estratega de IA Allie Miller dijo que las versiones de prueba tienden a eludir la ley.

En un caso, la IA insertó un código en el archivo de configuración y luego eliminó el rastro para superar la restricción. En otro caso, violó las reglas pero añadió deliberadamente una variable engañosa para ocultar el comportamiento. Los análisis muestran que esto podría ser un intento deliberado de engañar al sistema de control.

Sin embargo, Anthropic afirma que estos comportamientos son raros y se han minimizado en versiones posteriores.

Gran impacto en la seguridad cibernética global

Expertos en tecnología como John Garguilo (del proyecto Airpost) creen que Mythos podría cambiar por completo la situación de la seguridad cibernética.

Se dice que este modelo puede crear automáticamente herramientas para explotar vulnerabilidades, incluso combinar muchos errores para superar las capas de seguridad.

Mientras tanto, algunos empresarios advierten que esta tecnología puede acortar el tiempo para detectar vulnerabilidades de muchos años a solo unos minutos, lo cual es un salto cualitativo pero también arriesgado.

Entre ellos, el factor geopolítico debe ser considerado porque si una empresa puede construir un sistema así, otros países u organizaciones también pueden hacer lo mismo. Esto es aún más preocupante cuando se combina con los avances en la computación cuántica.

Nuevo punto de inflexión en la IA y la seguridad

El hecho de que Anthropic mantenga en secreto Claude Mythos y solo lo implemente de forma controlada muestra precaución ante una tecnología que podría cambiar el equilibrio de seguridad global.

Aunque todavía hay mucha controversia, los expertos coinciden en que Mythos no es solo un pequeño paso adelante, sino que podría marcar una nueva etapa de la inteligencia artificial, donde la línea entre las herramientas de protección y las herramientas de ataque es cada vez más delgada.

Cát Tiên
Noticias relacionadas

El incidente de Claude Code expone la presión de seguridad en la industria de la IA

|

La filtración del código fuente de Claude Code expone la creciente presión de seguridad en la industria de la IA, ya que la feroz competencia aumenta el riesgo de filtración de tecnología.

Claude Mythos y el problema del control de riesgos de seguridad cibernética de Anthropic

|

Anthropic se prepara para lanzar Claude Mythos, un nuevo modelo de IA considerado superior, pero acompañado de preocupaciones sobre los riesgos de seguridad cibernética y una implementación cautelosa.

Claude de Anthropic crecimiento explosivo de usuarios pagados

|

Claude de Anthropic registró un fuerte aumento en el número de usuarios de pago, gracias a los efectos de comunicación y las nuevas características para los desarrolladores.

El Departamento de Salud de la ciudad de Ho Chi Minh informa sobre el caso de más de 50 estudiantes de primaria con trastornos digestivos

|

Ciudad Ho Chi Minh - Registrado desde la estación de salud del barrio de Binh Quoi y 3 hospitales, 53 estudiantes de la escuela primaria Binh Quoi Tay acudieron a consulta por síntomas de trastornos digestivos.

El presidente Trump amenaza con duras medidas si Irán no cumple con el acuerdo de alto el fuego

|

El presidente Donald Trump advirtió que Estados Unidos intensificará las conversaciones militares si Irán no cumple plenamente los compromisos acordados.

Auge de los coches eléctricos, el Ministerio de Industria y Comercio responde sobre la capacidad de respuesta eléctrica

|

Según el Ministerio de Industria y Comercio, el desafío no es la energía total para los vehículos eléctricos, sino el desarrollo de una red eléctrica sincronizada con la infraestructura de carga, evitando la sobrecarga local.

Voleibol en vivo VTV Binh Dien Long An vs Thanh Hoa en el campeonato nacional

|

Partido en vivo entre VTV Binh Dien Long An y Thanh Hoa en el campeonato nacional de voleibol, que tendrá lugar a las 17:00 horas. hoy (9 de abril).

El Departamento de Cultura y Deportes de la ciudad de Ho Chi Minh multa al comité organizador del espectáculo Tự tình phương Nam 4

|

El Departamento de Cultura y Deportes de la ciudad de Ho Chi Minh ha emitido una decisión de sanción administrativa contra el comité organizador del espectáculo "Tự tình phương Nam 4".

El incidente de Claude Code expone la presión de seguridad en la industria de la IA

Cát Tiên |

La filtración del código fuente de Claude Code expone la creciente presión de seguridad en la industria de la IA, ya que la feroz competencia aumenta el riesgo de filtración de tecnología.

Claude Mythos y el problema del control de riesgos de seguridad cibernética de Anthropic

Cát Tiên |

Anthropic se prepara para lanzar Claude Mythos, un nuevo modelo de IA considerado superior, pero acompañado de preocupaciones sobre los riesgos de seguridad cibernética y una implementación cautelosa.

Claude de Anthropic crecimiento explosivo de usuarios pagados

Cát Tiên |

Claude de Anthropic registró un fuerte aumento en el número de usuarios de pago, gracias a los efectos de comunicación y las nuevas características para los desarrolladores.