DeepSeek lanza V3.2-Exp con técnica Sparse Attention y reduce más del 50 % en los precios de su API

TecnologíaInteligencia artificial

DeepSeek lanza V3.2-Exp con técnica Sparse Attention y reduce más del 50 % en los precios de su API

DeepSeek presenta V3.2-Exp con innovación en eficiencia y una significativa reducción de precios, buscando consolidar su posición en el competitivo mercado de IA.

Descripción

La startup china de inteligencia artificial DeepSeek ha lanzado una versión experimental de su modelo de lenguaje, V3.2-Exp, junto con una importante reducción en los precios de sus servicios API. La nueva versión, basada en el modelo anterior V3.1, incorpora la innovadora técnica DeepSeek Sparse Attention (DSA), diseñada para optimizar la eficiencia en el procesamiento de textos largos y centrarse en las áreas relevantes del input, reduciendo significativamente los costes computacionales sin comprometer la calidad de las respuestas.

Según informó la compañía en su página de Hugging Face, la tecnología DSA permite que los modelos se focalicen únicamente en los componentes más importantes del texto, a diferencia de los mecanismos tradicionales que consideran todos los tokens simultáneamente. Esto resulta en una notable reducción del uso de recursos, facilitando el procesamiento de secuencias extensas con mayor eficiencia.

Paralelamente, DeepSeek anunció una reducción de más del 50% en los precios de sus tarifas para la API, que entraron en vigor de inmediato para potenciar la adopción de sus servicios. Las tarifas actuales para procesar un millón de tokens de entrada son de 0,28 USD (antes 0,56 USD), y para tokens de salida, 0,42 USD. Además, ofrecen tarifas temporales para el modelo V3.1 hasta octubre de 2025, buscando captar mayor mercado en un sector altamente competitivo.

El modelo también presenta compatibilidad con chips chinos de Huawei, soportando formatos de precisión como FP8 y BF16. La implementación de FP8 permite reducir los requerimientos de memoria y acelerar los cálculos, aunque con una ligera pérdida de precisión, considerada suficiente para muchas aplicaciones de IA. Por su parte, BF16 supone un compromiso entre velocidad y exactitud, beneficiando asimismo a hardware con recursos limitados.

Con estos avances, DeepSeek busca posicionarse de manera agresiva en el mercado de las API de IA, enfrentando a otras startups chinas mediante precios competitivos. Sin embargo, su estrategia también genera preocupaciones respecto a la privacidad y la censura, temores comúnmente asociados a modelos de origen chino, a pesar de las ventajas tecnológicas y económicas que ofrece.