
OpenAI acaba de anunciar 2 modelos de IA teorica de codigo abierto llamados gpt-oss-120b y gpt-oss-20b con capacidades equivalentes a la linea o-series de la compañia. Esta es la primera vez desde el GPT-2 (lanzado en 2019) que OpenAI vuelve a lanzar un modelo de lenguaje de codigo abierto. Ambos se pueden descargar de forma gratuita en la plataforma Hugging Face utilizando la licencia Apache 2.0 que permite la comercializacion sin permiso ni pago.
Los modelos estan diseñados en diferentes tamaños: la version de 120 mil millones de parametros se puede ejecutar en una sola GPU Nvidia; la version de 20 mil millones es mas ligera y funciona bien en portatiles con 16 GB de RAM. OpenAI dice que ambos modelos utilizan una arquitectura integrada de expertos (MoE) que solo activa una pequeña parte de los parametros para cada operacion para optimizar el rendimiento.
En muchas escalas de medida se evalua que gpt-oss tiene una capacidad superior a los competidores abiertos como DeepSeek y Qwen aunque todavia esta por detras de la serie o interna. Por ejemplo en el examen Codeforces el gpt-oss-120b obtuvo 2622 puntos ligeramente mejor que el DeepSeek R1. Sin embargo la tasa de respuestas incorrectas sigue siendo un problema preocupante. Gpt-oss causa respuestas no estandar en mas del 49-53% de las preguntas en el estandar PersonQA mucho mas alta que el
En cuanto a la formacion OpenAI aplica tecnicas avanzadas como el aprendizaje aumentado (RL) y la cadena de razonamiento multiple similares a los modelos avanzados. Gpt-oss puede admitir agentes de IA llamados herramientas como buscar en la web o ejecutar codigo Python pero no puede procesar imagenes ni sonidos.
OpenAI dijo que no publicara datos de entrenamiento por razones legales en el contexto de las demandas relacionadas con los derechos de autor que continuan. La empresa tambien realiza pruebas de seguridad para limitar el riesgo de que el modelo se utilice para fines maliciosos como la fabricacion de armas o los ciberataques.
Queremos que el mundo se construya sobre una plataforma de IA abierta creada en Estados Unidos y basada en valores democraticos' enfatizo el CEO Sam Altman. Sin embargo la carrera por la IA abierta sigue siendo feroz con la espera de DeepSeek R2 y nuevos modelos de superinteligencia de Meta en el futuro.