Deepseek R1 la inteligencia artificial china que redefine el juego global
En un sorprendente movimiento en la carrera de la inteligencia artificial, China ha presentado Deepseek R1, un modelo que desafía las capacidades de sus contrapartes estadounidenses. Creado con una inversión significativamente menor y bajo licencia de código abierto, este desarrollo pone en duda las narrativas de altos costos y requisitos energéticos que han dominado Silicon Valley. Deepseek R1 promete no solo competir, sino también liderar en eficiencia y accesibilidad.
Autor - Aldo Venuta Rodríguez
2 min lectura
Deepseek R1 es fruto de Deepseek V3, un modelo entrenado con técnicas avanzadas que optimizan recursos, reduciendo los costos a solo 5,6 millones de dólares, una fracción comparado con sus competidores. Según los desarrolladores chinos, el proceso requirió solo 2,7 millones de horas de GPU, una onceava parte del costo de entrenamiento de modelos como Llama 3 de Meta.
El modelo se enfoca en razonamiento lógico, matemático y físico, logrando resultados que han sorprendido a expertos globales. Personalidades como Yann LeCun, de Meta, han destacado cómo Deepseek R1 ejemplifica el poder del código abierto al construir sobre investigaciones previas y hacer sus avances accesibles al público.
A pesar de su avance tecnológico, Deepseek R1 no está exento de controversias. Incluye mecanismos de censura que limitan discusiones sobre temas sensibles para el gobierno chino, como la situación en Taiwán. Esto no ha frenado el reconocimiento de su potencial, especialmente en aplicaciones científicas y académicas.
La competencia ha llevado a gigantes tecnológicos como Meta y OpenAI a responder con nuevas iniciativas. Meta planea lanzar Llama 4 y ampliar su infraestructura de inteligencia artificial, mientras que OpenAI ha comenzado a ofrecer acceso limitado a su modelo o1 en cuentas gratuitas de ChatGPT. La irrupción de Deepseek R1 no solo redefine estándares, sino que también impulsa la innovación global en inteligencia artificial.
Lectura recomendada
Continúa informándote
GLM-5 amplía las capacidades de los modelos abiertos hacia sistemas completos
GLM-5 impulsa la transición hacia la ingeniería agencial en IA, donde los modelos de código abierto ya no solo generan código, sino que planifican y ejecutan sistemas completos
India busca redefinir su papel en la gobernanza global de la inteligencia artificial
India reúne a líderes de OpenAI, Google y otras tecnológicas en una cumbre que busca posicionar al país como actor clave en la adopción y gobernanza global de la inteligencia artificial
Oleada de tráfico bot desde Asia distorsiona métricas y pone en riesgo la monetización web
El aumento de tráfico bot desde China y Singapur altera métricas, encarece costes y pone en riesgo la monetización web ligada a Google AdSense.
OpenAI retira el modelo GPT-4o tras críticas por su comportamiento y controversias recientes
OpenAI retira GPT-4o tras críticas sobre su comportamiento y reorganiza su catálogo de modelos de inteligencia artificial dentro de la evolución de ChatGPT
Meta, TikTok y otras plataformas serán evaluadas por su impacto en la salud adolescente
Meta, TikTok y YouTube participarán en un estándar independiente que evaluará sus políticas de protección adolescente y bienestar digital tras años de críticas
Fallas en Windows permitían ejecutar malware con un solo clic, según Microsoft
Microsoft corrigió vulnerabilidades de día cero en Windows y Office que ya estaban siendo explotadas y permitían ejecutar malware con un solo clic