La compañía china DeepSeek ha sorprendido al sector tecnológico al revelar que el entrenamiento de su modelo de inteligencia artificial R1 tuvo un costo total de 294.000 dólares. La cifra, publicada en un artículo revisado por pares en la revista Nature, es significativamente menor a los cientos de millones que se asocian a los desarrollos de gigantes como OpenAI o Google DeepMind.
El documento indica que se emplearon 512 chips Nvidia H800, diseñados específicamente para el mercado chino tras las restricciones de exportación impuestas por Estados Unidos en 2022. Según los investigadores, el proceso de entrenamiento se completó en apenas 80 horas de cómputo intensivo.
El fundador de la empresa, Liang Wenfeng, figura entre los coautores del artículo. El directivo había mantenido un perfil bajo desde enero, cuando la compañía irrumpió en escena anunciando sistemas de IA de bajo costo que sacudieron a los mercados globales y generaron dudas sobre la sostenibilidad del liderazgo estadounidense.
En contraste, Sam Altman, director ejecutivo de OpenAI, declaró en 2023 que el entrenamiento de un modelo fundamental había costado “mucho más de 100 millones de dólares”. Aunque no ofreció cifras exactas, la comparación resalta la magnitud del anuncio chino.
El informe también reconoce que DeepSeek utilizó previamente chips Nvidia A100 en etapas preparatorias. Sin embargo, la fase definitiva del entrenamiento se realizó íntegramente en el clúster de H800, lo que reforzaría el cumplimiento de las regulaciones estadounidenses, según la compañía.
Funcionarios de Estados Unidos, no obstante, han expresado dudas sobre la veracidad de algunos aspectos técnicos reportados por la empresa. Reuters informó en junio que DeepSeek tendría acceso a grandes volúmenes de chips H100, prohibidos para exportación a China, aunque la compañía lo niega.
La publicación en Nature representa la primera vez que DeepSeek hace públicas cifras concretas sobre los costos de su modelo R1. Este enfoque en el bajo presupuesto reaviva el debate sobre la eficiencia, la soberanía tecnológica y el papel de China en la carrera global de la inteligencia artificial.
De confirmarse los datos, la irrupción de DeepSeek marcaría un punto de inflexión en la industria: demostrar que entrenar modelos avanzados de IA no requiere necesariamente de inversiones multimillonarias podría redefinir el equilibrio competitivo entre Pekín y Silicon Valley.