DeepSeek presenta modelo V4 con soporte para chips de Huawei

El modelo de código abierto llega con 1 millón de tokens de contexto y soporte para chips de Huawei, marcando el mayor lanzamiento de DeepSeek desde R1.

DeepSeek presenta modelo V4 con soporte para chips de Huawei
e1b8887d-1ff4-4178-97ce-6eb6d72702fd.jpg

Conclusiones Clave

  • DeepSeek lanzó el modelo V4 con soporte nativo para chips Huawei Ascend 950 y una ventana de contexto de 1 millón de tokens.
  • Los chips Ascend de Huawei han recibido grandes preordenes, reflejando la estrategia de China para aumentar la autosuficiencia en IA.

Compartir este artículo

DeepSeek lanzó el modelo en versión preliminar de su AI V4 el viernes, introduciendo un nuevo sistema de código abierto con una ventana de contexto de 1 millón de tokens y soporte para los chips de IA domésticos de Huawei.

La startup china de IA lanzó el modelo en dos versiones. DeepSeek V4 Pro tiene 1.6 billones de parámetros totales y 49 mil millones de parámetros activos, mientras que DeepSeek V4 Flash tiene 284 mil millones de parámetros totales y 13 mil millones de parámetros activos, según el comunicado oficial de DeepSeek.

DeepSeek indicó que V4 Pro está diseñado para un rendimiento más fuerte en tareas complejas, mientras que V4 Flash se posiciona como una opción más rápida y económica. La versión Pro tiene buen desempeño en áreas como la codificación agente y la programación competitiva, aunque sigue detrás de los modelos de fuente cerrada líderes de empresas como Google y OpenAI.

El lanzamiento también marca el primer modelo importante de DeepSeek adaptado para hardware de Huawei. El supernodo Ascend, impulsado por los chips de IA Ascend 950, apoyará completamente a DeepSeek V4 tras el lanzamiento preliminar, subrayando el esfuerzo de China por reducir la dependencia en infraestructura extranjera de IA.

Ese cambio de hardware es central en el lanzamiento. Los modelos anteriores de DeepSeek estaban asociados con chips de Nvidia, pero las restricciones de exportación de EEUU han empujado a los desarrolladores de IA chinos a depender más de alternativas domésticas. La infraestructura de Huawei también contribuyó al entrenamiento de la versión Flash de V4.

El lanzamiento ocurre más de un año después de que el modelo R1 de DeepSeek sacudiera los mercados globales de IA al demostrar que un laboratorio chino podría construir modelos competitivos a costos reportados más bajos. V4 se presenta como otro desafío para las empresas de IA de EEUU, con DeepSeek afirmando un rendimiento frente a rivales de fuente cerrada de primer nivel mientras mantiene la versión pública de código abierto.

DeepSeek ha hecho disponible V4 a través de chat.deepseek.com bajo los modos Expert y Instant, mientras que su API también fue actualizada el viernes.

Cargando...