DeepSeek presenta modelo preliminar V4 con soporte para chip de Huawei
El modelo de código abierto se lanza con soporte para chip de Huawei y ventana de contexto de 1 millón de tokens, marcando el mayor lanzamiento de DeepSeek desde R1.
Conclusiones Clave
- DeepSeek lanzó el modelo V4 con soporte nativo para los chips Huawei Ascend 950 y una ventana de contexto de 1 millón de tokens.
- Los chips Ascend de Huawei han obtenido importantes pedidos anticipados, reflejando la estrategia de China para aumentar la autosuficiencia en IA.
Compartir este artículo
DeepSeek lanzó la versión preliminar de su modelo de IA V4 el viernes, introduciendo un nuevo sistema de código abierto con una ventana de contexto de 1 millón de tokens y soporte para los chips de IA domésticos de Huawei.
La startup china de IA lanzó el modelo en dos versiones. DeepSeek V4 Pro tiene 1,6 billones de parámetros totales y 49 mil millones de parámetros activos, mientras que DeepSeek V4 Flash tiene 284 mil millones de parámetros totales y 13 mil millones de parámetros activos, según el comunicado oficial de DeepSeek.
DeepSeek afirmó que V4 Pro está diseñado para un rendimiento más fuerte en tareas complejas, mientras que V4 Flash se posiciona como una opción más rápida y económica. La versión Pro funciona bien en áreas como la codificación agente y la programación competitiva, aunque todavía está por detrás de los modelos de código cerrado de empresas como Google y OpenAI.
El lanzamiento también marca el primer modelo importante de DeepSeek adaptado para el hardware de Huawei. El supernodo Ascend de Huawei, impulsado por chips de IA Ascend 950, respaldará completamente DeepSeek V4 tras la publicación preliminar, subrayando el esfuerzo de China por reducir la dependencia de la infraestructura de IA extranjera.
Ese cambio de hardware es central para el lanzamiento. Los modelos anteriores de DeepSeek estaban asociados con chips de Nvidia, pero las restricciones de exportación de EE.UU. han empujado a los desarrolladores de IA chinos a depender más de alternativas domésticas. La infraestructura de Huawei también contribuyó al entrenamiento de la versión Flash de V4.
El lanzamiento llega más de un año después de que el modelo R1 de DeepSeek sacudiera los mercados globales de IA al demostrar que un laboratorio chino podía construir modelos competitivos a costos reportados más bajos. V4 se presenta como otro desafío para las compañías de IA de EE.UU., con DeepSeek afirmando un rendimiento frente a rivales de código cerrado de primer nivel mientras mantiene la versión pública de código abierto.
DeepSeek ha puesto a disposición V4 a través de chat.deepseek.com bajo los modos Experto e Instantáneo, mientras que su API también fue actualizada el viernes.
