DeepSeek R2: un nuevo modelo de inteligencia artificial chino con avance en rendimiento y autosuficiencia tecnológica

TecnologíaInteligencia artificial

DeepSeek R2: un nuevo modelo de inteligencia artificial chino con avance en rendimiento y autosuficiencia tecnológica

DeepSeek prepara su próximo modelo, que promete avances en rendimiento, autosuficiencia tecnológica y costos, posicionándose como una posible competencia global.

Descripción

Se rumorea que DeepSeek, una de las principales compañías chinas en inteligencia artificial, pronto revelará su próximo modelo denominado DeepSeek R2. Aunque aún no ha sido confirmado oficialmente, la expectación crece por las filtraciones que sugieren innovaciones importantes respecto a su predecesor, el R1. Este nuevo modelo podría suponer un avance relevante en el mercado de IA, en parte porque estaría entrenado principalmente en procesadores Huawei AI, lo que refleja un fuerte enfoque en la autosuficiencia tecnológica de China.

Según los rumores, el DeepSeek R2 utilizará una arquitectura híbrida MoE (Mixture of Experts), que combina diferentes mecanismos para optimizar tareas complejas y mejorar su rendimiento. Se estima que el modelo contará con más de 1,2 billones de parámetros, el doble que su predecesor, el R1, además de incluir 78.000 millones de activos, lo que destaca su capacidad de procesamiento y precisión.

En cuanto a sus capacidades comparativas, se especula que el R2 podría competir con modelos como GPT-4 Turbo y Google Gemini 2.0 Pro, ofreciendo ventajas económicas considerables: se dice que podría reducir los costes por token un 97,4% respecto a GPT-4, con precios estimados de aproximadamente 0,07 $ por millón de tokens de entrada y 0,27 $ por millón de tokens de salida. Esto hace que la opción de DeepSeek sea especialmente atractiva para empresas que buscan reducir gastos en inteligencia artificial sin sacrificar calidad.

Además, los datos filtrados indican que el R2 aprovechará un 82% de uso de los chips Huawei Ascend 910B, alcanzando una potencia de 512 petaFLOPS en FP16. Este enfoque señala una estrategia de integración vertical, en la que DeepSeek ha invertido en recursos nacionales, favoreciendo la independencia tecnológica y el control de toda la cadena de suministro. La decisión de entrenar el modelo principalmente en procesadores chinos también indica un movimiento hacia la internacionalización de la tecnología y la reducción de dependencia de proveedores occidentales.

No obstante, cabe recordar que toda esta información aún no es oficial y debe tomarse con cautela, ya que el modelo final puede variar respecto a las filtraciones actuales. De confirmarse, el DeepSeek R2 podría consolidarse como una pieza clave en el escenario global de inteligencia artificial, poniendo en jaque a los grandes gigantes tecnológicos y alterando las dinámicas económicas del sector.