DeepSeek lanza un nuevo modelo que ayuda a reducir la mitad de los costos de API

Cát Tiên (THEO techcrunch) |

La tecnologia Sparse Attention de DeepSeek optimiza el transformador ayudando a reducir la carga del servidor pero manteniendo la eficiencia de procesamiento abriendo nuevas direcciones para la IA a bajo costo.

El 29 de septiembre (hora de EE. UU.) un equipo de investigacion de DeepSeek anuncio un nuevo modelo de prueba llamado V3.2-exp diseñado para reducir significativamente los costos de razonamiento en tareas de contexto largo. Este modelo se presento en la plataforma Hugging Face junto con un articulo academico compartido publicamente en GitHub.

El punto culminante de V3.2-exp radica en el mecanismo DeepSeek Sparse Attention (un sistema de atencion superficial). En lugar de procesar todos los datos este sistema utiliza un modulo llamado 'configuracion de marcadores setmicos' para priorizar la extraccion de textos importantes en la ventana contextual.

Luego otro modulo llamado'sistema de seleccion de codigo de notificacion detallada' seleccionara los tokens importantes para incluirlos en una ventana de atencion limitada. Este enfoque ayuda a reducir la carga del servidor pero aun mantiene la capacidad de procesar segmentos de contexto largos.

Segun las pruebas iniciales DeepSeek dijo que el coste de ejecutar un comando de llamada de la API puede reducirse hasta en un 50% en situaciones que requieren una gran cantidad de contexto.

Aunque se necesitan mas evaluaciones independientes para la autenticacion la publicacion del modelo en Hugging Face pronto abrira el camino para que terceros lo prueben y certifiquen.

El lanzamiento del V3.2-exp continua una serie de esfuerzos para resolver el problema del costo de la deducccion que es uno de los mayores desafios en la operacion del modelo de IA.

A diferencia del costo de capacitacion inicial el costo de la especulacion esta directamente relacionado con la infraestructura de servidores para servir a los usuarios y siempre es una gran carga para las empresas que implementan la IA.

DeepSeek una empresa con sede en China que llamo la atencion a principios de año con el modelo R1 esta principalmente capacitada en aprendizaje intensivo a bajo costo. Sin embargo R1 no ha creado una revolucion como se esperaba y el interes por DeepSeek ha disminuido gradualmente en los ultimos meses.

Sin embargo con este nuevo mecanismo DeepSeek esta mostrando un nuevo enfoque para optimizar la arquitectura transformadora. Esta solucion puede no ser tan ruidosa como R1 pero se considera que aporta lecciones practicas especialmente para los proveedores de servicios de IA en Estados Unidos en un contexto en el que la necesidad de reducir los costos de razonamiento se esta volviendo cada vez mas urgente.

Cát Tiên (THEO techcrunch)
Noticias relacionadas

Cada vez mas paises prohibieron a Deepseek

|

La Republica Checa es el ultimo pais que prohibio los profundidades profundas en todas las agencias y organizaciones gubernamentales, por preocupaciones sobre la ciberseguridad.

Alemania les pide a Apple y Google que bloqueen las aplicaciones AI Deepsek

|

La Agencia de Proteccion de Datos de Berlin (Alemania) acaba de pedirle a Apple y Google que consideren bloquear la inteligencia artificial de Deepseek debido a las preocupaciones sobre las violaciones de los datos del usuario.

Los empleados de Microsoft estan prohibidos de usar DeepSeek

|

Microsoft oficialmente prohibio a sus empleados el uso de la aplicacion DeepSeek por preocupaciones de seguridad de datos y riesgo de propaganda.

Fuertes lluvias e inundaciones complicadas: el General Luong Tam Quang exige que la seguridad de la vida de las personas sea lo primero

|

En medio de las complejas lluvias e inundaciones en la region central el General Luong Tam Quang pidio a la fuerza policial que rescate a la gente y que proteja la vida de la gente por encima de todo.

Se espera que el Hospital Bach Mai Viet Duc Base 2 se inaugure el 19 de diciembre

|

El Viceprimer Ministro solicito la preparacion de planes de recursos humanos y la promocion de la compra y licitacion de equipos para el Hospital Bach Mai y Viet Duc de base 2.

Continuar uniendo fuerzas para apoyar a los compatriotas de las provincias afectadas por la tormenta numero 11 la tormenta numero 12 y las inundaciones

|

La delegacion presidenta del Comite Central del Frente de la Patria de Vietnam pidio que continuen uniendo fuerzas para apoyar a los compatriotas de las provincias afectadas por la tormenta numero 11 la tormenta numero 12 y las inundaciones.

El lago Ke Go aumenta el caudal de descarga

|

Ha Tinh - La unidad operadora del lago Ke Go anuncia que aumentara el caudal de descarga en el rango de 350 m3/s a 800 m3/s a partir de las 17:00 horas del 31 de octubre lo que preocupa a la region baja.

El camino de regreso de Jack tras el escandalo

|

Jack ha anunciado la suspension temporal de sus actividades pero ¿cuales son las posibilidades de regreso de este cantante despues de que ocurriera el escandalo?

Cada vez mas paises prohibieron a Deepseek

NGUYỄN ĐĂNG |

La Republica Checa es el ultimo pais que prohibio los profundidades profundas en todas las agencias y organizaciones gubernamentales, por preocupaciones sobre la ciberseguridad.

Alemania les pide a Apple y Google que bloqueen las aplicaciones AI Deepsek

HẠO THIÊN (THEO CNBC) |

La Agencia de Proteccion de Datos de Berlin (Alemania) acaba de pedirle a Apple y Google que consideren bloquear la inteligencia artificial de Deepseek debido a las preocupaciones sobre las violaciones de los datos del usuario.

Los empleados de Microsoft estan prohibidos de usar DeepSeek

Anh Vũ |

Microsoft oficialmente prohibio a sus empleados el uso de la aplicacion DeepSeek por preocupaciones de seguridad de datos y riesgo de propaganda.