Deepseek consigue reducir significativamente los costos de entrenamiento de su modelo R1 utilizando infraestructura eficiente y métodos innovadores

TecnologíaDeepseek

Deepseek consigue reducir significativamente los costos de entrenamiento de su modelo R1 utilizando infraestructura eficiente y métodos innovadores

Deepseek logra una innovación que disminuye los costos en inteligencia artificial, demostrando que la eficiencia y la innovación pueden ir de la mano.

Descripción

El modelo de razonamiento R1 desarrollado por la empresa china Deepseek ha logrado un avance significativo en la reducción de costes en comparación con la competencia internacional. Según un artículo revisado por pares y publicado en la revista especializada Nature, la capacitación del modelo R1 tuvo un coste total de aproximadamente 294.000 $, empleando una infraestructura eficiente y de bajo coste en lugar de las costosas instalaciones que suelen utilizar otras empresas del sector.

Este entrenamiento se realizó utilizando 512 chips Nvidia H800, lo que demuestra que la tecnología puede desarrollarse de manera efectiva sin la necesidad de gastar cientos de millones de dólares en infraestructura. Además, Deepseek introdujo un innovador método de ensayo y error para mejorar la precisión del modelo, un enfoque que ha inspirado a otras compañías en el campo de la inteligencia artificial.

Los excelentes resultados en eficiencia y coste han generado un impacto en el mercado, cuestionando la necesidad de inversiones multimillonarias en infraestructuras costosas, especialmente en Estados Unidos. La estrategia de Deepseek no solo ha reducido los gastos, sino que también ha demostrado que la innovación en métodos de entrenamiento puede lograrse con recursos mucho más limitados.

Asimismo, el informe revela que el desarrollo completo del modelo R1 tuvo un coste estimado de unos 6 millones de dólares, una cifra considerablemente menor que la habitual en otros líderes en inteligencia artificial como OpenAI. Esta tendencia pone en duda el modelo de inversión basado en infraestructuras extremadamente costosas, abriendo la puerta a alternativas más accesibles para la innovación en el sector.