La empresa emergente china de IA DeepSeek ha lanzado dos nuevos modelos de lenguaje (LLM) llamados DeepSeek V4 Flash y DeepSeek V4 Pro, continuando su estrategia de competencia con alto rendimiento pero bajo costo.
Este movimiento se produce más de un año después de que versiones anteriores como V3.2 y R1 llamaran la atención mundial, desafiando la posición de muchos gigantes en la industria de la inteligencia artificial.
Los dos nuevos modelos V4 se lanzaron en código abierto, con ventanas contextuales de más de 1 millón de tokens, lo que permite procesar una enorme cantidad de datos, como todo el documento o el código fuente en una sola entrada.
Entre ellos, la versión Pro tiene una escala de hasta 1,6 billones de parámetros (49 mil millones de parámetros operativos), considerada uno de los modelos de código abierto más grandes en la actualidad. Esta cifra supera a competidores como Moonshot AI con Kimi K2. 6 o MiniMax con M1.
La versión Flash más pequeña con alrededor de 284 mil millones de parámetros, está diseñada para optimizar los costos y la velocidad de procesamiento.
Ambos modelos solo admiten salidas de texto, no crean contenido multimedia como imágenes o videos y son diferentes de algunos sistemas de IA cerrados actuales.
En cuanto a la tecnología, DeepSeek divide las tareas y las asigna a módulos especializados para que las procesen. Al mismo tiempo, la empresa combina muchas técnicas avanzadas como la digestión de modelos y el mecanismo de atención multidireccional, lo que ayuda a optimizar el rendimiento incluso cuando se utiliza hardware menos avanzado.
Anteriormente, DeepSeek aprovechó la GPU H20 de Nvidia; en la nueva generación, cambiaron a chips desarrollados por Huawei.
Según el anuncio, DeepSeek V4 Pro logra un alto rendimiento en las pruebas de razonamiento y puede competir con los modelos líderes de OpenAI o Google en ciertas tareas.
Sin embargo, la compañía también reconoce que sus modelos todavía son unos 3 a 6 meses más lentos que los sistemas más avanzados en términos de conocimiento general.
El punto más notable reside en la estrategia de precios. DeepSeek continúa manteniendo la ventaja de bajo costo cuando V4 Flash tiene un precio de solo 0,14 USD por cada millón de tokens de entrada y 0,28 USD de salida. Esta se considera una cifra mucho menor que los productos equivalentes en el mercado.
Mientras tanto, el V4 Pro también tiene un precio más competitivo en comparación con modelos de gama alta como Gemini o GPT.
La aparición de la línea V4 muestra que DeepSeek está persiguiendo su propio camino, que es optimizar el rendimiento sobre costos, en lugar de competir solo por la escala y la potencia de cálculo. Esto contribuye a cambiar la visión sobre los costos de desarrollo de la IA, al tiempo que aumenta la presión competitiva en toda la industria.
En el contexto de que las grandes empresas de tecnología invierten continuamente fuertemente en IA, el hecho de que DeepSeek proporcione un modelo de código abierto, barato pero altamente eficiente puede impulsar una ola de aplicaciones más amplia.
Si mantiene esta ventaja, la empresa china tiene la capacidad de seguir remodelando la carrera global de IA en los próximos años.