Ilustración de un chip chino con el logo de DeepSeek, conectado a un modelo de IA eficiente, contrastando con un chip Nvidia tachado.
Ilustración de un chip chino con el logo de DeepSeek, conectado a un modelo de IA eficiente, contrastando con un chip Nvidia tachado.

La apuesta de DeepSeek por modelos eficientes y abiertos cambia las reglas, útil contexto para un colega que sigue la carrera tecnológica global.

DeepSeek: IA barata para liberar a China del chip Flujo de la historia y datos clave

DeepSeek, una startup china de inteligencia artificial, está desafiando el dominio global de empresas como Nvidia no con modelos más potentes, sino con una estrategia de eficiencia extrema y precios bajos. Su modelo DeepSeek-V4-Pro, aunque técnicamente inferior a GPT-5 u Opus, ofrece un rendimiento competitivo a un costo significativamente menor gracias a arquitecturas como Mixture of Experts (MoE) y Multi-head Latent Attention (MLA), que reducen drásticamente el uso de memoria HBM.

Estas innovaciones permiten que los modelos funcionen en hardware chino menos avanzado, como memorias NAND o SSD fabricadas por empresas como YMTC y CXMT, evitando así la dependencia de componentes estadounidenses restringidos por sanciones. Además, DeepSeek ha desarrollado Tile Kernels, una alternativa al ecosistema CUDA de Nvidia, para operar eficientemente en chips como los Ascend AI de Huawei.

La empresa también publica sus pesos de modelo abiertamente, fomentando un estándar técnico que impulse la adopción por parte del hardware nacional. Con una ronda de financiación prevista de 10.000 millones de dólares, DeepSeek busca consolidar una industria de IA china autosuficiente, donde el software impulsa la independencia tecnológica del país.

Datos clave

  • DeepSeek-V4-Pro mantiene permanentemente un descuento del 75%, ofreciendo 1M tokens de entrada por 0,435 dólares.
  • El modelo usa solo 5,48 GB de memoria HBM por millón de tokens, frente a los 89 GB de Qwen 3 de Alibaba.
  • Técnicas como MLA reducen el uso de memoria de contexto en un 90%, permitiendo usar memorias NAND o SSD chinas.
  • DeepSeek publica sus pesos abiertamente y comparte innovaciones técnicas para estandarizar su arquitectura en el hardware local.
  • La empresa prepara una ronda de financiación de 10.000 millones de dólares, con una valoración estimada de hasta 50.000 millones.

Explicación visual de noticias de Canto. Las herramientas de IA pueden apoyar la producción. Política editorial