El nuevo modelo de IA de Alibaba llama la atención de Elon Musk

CÁT TIÊN |

El nuevo modelo de IA de Alibaba llama la atención de Elon Musk al lograr un alto rendimiento.

En el contexto de que las empresas de tecnología desarrollan continuamente modelos de inteligencia artificial cada vez más grandes y complejos, Alibaba elige un camino diferente al presentar una serie de nuevos modelos de IA compactos de la línea Qwen 3. 5.

Los cuatro nuevos modelos incluyen Qwen 3.5-0.8B, 2B, 4B y 9B con una escala de parámetro de 0,8 a 9 mil millones. Según Alibaba, estos modelos están diseñados para proporcionar una poderosa capacidad de razonamiento pero aún optimizados en tamaño, para servir a los desarrolladores que necesitan soluciones de IA eficientes y flexibles.

Es de destacar que todos los modelos Qwen 3.5 están construidos en la misma arquitectura y son multifuncionales, lo que permite procesar tanto texto como imágenes.

Cada modelo tiene dos versiones, incluyendo la versión "básica" para los desarrolladores que desean ajustarse a sí mismos y la versión "guía" que se puede implementar de inmediato.

Entre ellos, el Qwen 3.5-9B es el modelo más grande de esta línea y está atrayendo mucha atención. Según Alibaba, este modelo tiene un rendimiento muy similar a los modelos más grandes, incluido el GPT-oSS-120B.

A pesar de la considerable diferencia de tamaño, el Qwen 3.5-9B todavía muestra capacidad de razonamiento y procesamiento competitivo de conocimientos en algunas pruebas.

La compañía dice que en tareas como el razonamiento lógico, la resolución de problemas y el análisis de documentos, Qwen 3.5-9B puede lograr resultados equivalentes a los grandes chatbots de IA como ChatGPT de OpenAI o Gemini de Google.

En el lado opuesto, los dos modelos más pequeños, Qwen 3.5-0.8B y 2B, están optimizados para funcionar en dispositivos con capacidad de cálculo limitada, como computadoras portátiles o teléfonos inteligentes.

Aunque su capacidad de razonamiento no es tan fuerte como la de las versiones más grandes, todavía pueden procesar tanto texto como imágenes.

Los modelos Qwen 3.5 ya se han lanzado con peso abierto, lo que permite a los desarrolladores descargar y ejecutar localmente a través de plataformas populares como Hugging Face o ModelScope.

El lanzamiento de esta línea de modelos también atrajo la atención de la comunidad tecnológica. En la red social X, el CEO de xAI, Elon Musk, comentó que los modelos Qwen 3.5 poseen una "densidad de inteligencia impresionante", es decir, la capacidad de mostrar una alta capacidad de razonamiento y manejo de tareas a pesar de la pequeña escala de parámetros.

El éxito de Qwen 3.5 muestra una nueva tendencia en el desarrollo de la IA, en lugar de centrarse solo en expandir la escala, las empresas están buscando optimizar el rendimiento en modelos más pequeños, lo que facilita la implementación de la IA y ahorra recursos de cálculo.

CÁT TIÊN
Noticias relacionadas

ByteDance se pronuncia después de que se acusara al modelo de IA de infracción de derechos de autor

|

ByteDance dijo que fortalecerá las medidas de protección para el modelo AI Seedance 2.0, después de recibir quejas sobre infracciones de derechos de autor.

Nuevo modelo de IA hace que Hollywood dude

|

El modelo de IA que crea el video Seedance 2.0 de ByteDance está causando conmoción en Hollywood debido al riesgo de infracción flagrante de derechos de autor.

El CEO de Google DeepMind señala una gran laguna en los modelos de IA modernos

|

El CEO de Google DeepMind, Demis Hassabis, cree que los modelos de IA actuales todavia carecen de las competencias basicas para comprender y simular realmente el mundo.

Una gasolinera en Hanoi deja de vender, anuncia que se queda sin gasolina

|

Hanoi - Aunque ha reservado proactivamente fuentes de bienes, debido a la alta demanda, la oferta es difícil de importar, por lo que una gasolinera en Ha Dong ha anunciado que se ha quedado sin gasolina.

Camioneta se estrella contra casa de civiles tras chocar con camión en la Carretera Nacional 1

|

Gia Lai - Después de una colisión con un camión en la Carretera Nacional 1, una camioneta se estrelló repentinamente contra una casa al borde de la carretera, causando graves daños al vehículo y a la conductora con abrasiones.

Un nuevo recluta habla de su primera comida en el ejército

|

Quang Tri - Los nuevos reclutas de la guardia fronteriza expresaron entusiasmo al disfrutar de su primera comida en la unidad, familiarizándose rápidamente con el estilo de vida militar.

Verter basura justo debajo del mar prohibido, junto a la escuela, la gente propone instalar cámaras de IA

|

Hanoi - La situación del vertido indiscriminado de residuos domésticos en algunas áreas del barrio de Ngoc Ha causa contaminación, la gente espera instalar pronto cámaras de IA para monitorear y manejar.

Las acciones de petróleo y gas obtienen fuertes ganancias después de una serie de días de fuertes ganancias

|

Después de algunas sesiones de fuertes avances gracias a las ganancias de las tensiones en Oriente Medio, el grupo de acciones de petróleo y gas sufrió una fuerte presión de toma de ganancias y cayó al precio mínimo simultáneamente.

ByteDance se pronuncia después de que se acusara al modelo de IA de infracción de derechos de autor

NGUYỄN ĐĂNG |

ByteDance dijo que fortalecerá las medidas de protección para el modelo AI Seedance 2.0, después de recibir quejas sobre infracciones de derechos de autor.

Nuevo modelo de IA hace que Hollywood dude

NGUYỄN ĐĂNG (THEO TECHCRUNCH) |

El modelo de IA que crea el video Seedance 2.0 de ByteDance está causando conmoción en Hollywood debido al riesgo de infracción flagrante de derechos de autor.

El CEO de Google DeepMind señala una gran laguna en los modelos de IA modernos

Cát Tiên |

El CEO de Google DeepMind, Demis Hassabis, cree que los modelos de IA actuales todavia carecen de las competencias basicas para comprender y simular realmente el mundo.