¿Cuánto más CO₂ generan los modelos de IA con razonamiento?

Los modelos con razonamiento generan entre 4 y 6 veces más emisiones de CO₂ que sus versiones estándar del mismo tamaño debido a la generación adicional de tokens de "pensamiento".

¿Cuál fue la diferencia de emisiones entre el modelo más y menos eficiente?

El modelo menos eficiente (Deepseek-R1 70B) emitió 2.042,4 gramos de CO₂ frente a los 27,7 gramos del más eficiente (Qwen 7B), una diferencia de 74 veces.

¿Qué temas resultan más costosos computacionalmente para la IA?

Los dominios simbólicos y abstractos como Álgebra Abstracta demandan más computación y recursos, alcanzando solo 51,4% de precisión promedio comparado con 76,3% en Historia Universal.

¿Existe algún modelo que combine alta precisión con menor impacto ambiental?

Sí, el modelo Cogito 70B con razonamiento logró la máxima precisión (84,9%) mientras emitía 34,3% menos CO₂ que otros modelos de razonamiento de tamaño similar.

Noticia Ciencia

Publicado: 20 jun. 2025 - 07:56 UTC

Modelos de IA con razonamiento mejoran la precisión pero incrementan emisiones de CO₂ significativamente

Estudio evalúa 14 modelos de lenguaje grandes y revela compensaciones entre rendimiento y sostenibilidad ambiental

3 min lectura

Autor - Aldo Venuta Rodríguez

Créditos: Iceebook

Una nueva investigación del Centro de Ciencias Digitales e Inteligencia Artificial de Múnich revela que los modelos de inteligencia artificial con capacidades de razonamiento mejoran significativamente la precisión de sus respuestas, pero a costa de generar emisiones de CO₂ sustancialmente mayores. El estudio analizó 14 modelos de lenguaje grandes con parámetros que van desde 7 mil millones hasta 72 mil millones.

Los investigadores evaluaron modelos como Llama3.1 de Meta, Qwen de Alibaba y Deepseek R1, sometiendo cada uno a 500 preguntas de opción múltiple y 500 de respuesta libre del conjunto de datos Massive Multitask Language Understanding (MMLU). Las emisiones se midieron utilizando una GPU NVIDIA A100 y se convirtieron aplicando un factor de emisión de 480 gramos de CO₂ por kilovatio hora.

Los resultados muestran diferencias dramáticas en el consumo energético. El modelo más eficiente, Qwen 7B, generó apenas 27,7 gramos de CO₂ equivalente para procesar las 1.000 preguntas, pero alcanzó solo un 32,9% de precisión. En contraste, el modelo Deepseek-R1 70B con razonamiento habilitado emitió 2.042,4 gramos de CO₂ equivalente, logrando una precisión del 78,9%.

El modelo Cogito 70B con razonamiento demostró el mejor equilibrio entre rendimiento y eficiencia ambiental, alcanzando la máxima precisión del 84,9% mientras emitía 1.341,1 gramos de CO₂ equivalente, un 34,3% menos que Deepseek-R1 70B. Esta configuración representa una mejora de 7,6 puntos porcentuales en precisión comparado con su versión sin razonamiento.

La investigación también reveló variaciones significativas según el tema analizado. Los modelos obtuvieron mejores resultados en Historia Universal de Secundaria, con un promedio de 76,3% de respuestas correctas, mientras que el Álgebra Abstracta presentó el mayor desafío con solo 51,4% de aciertos. Los dominios simbólicos y abstractos demandaron sistemáticamente más computación y produjeron menor precisión.

Un factor clave en el consumo energético es la generación de tokens, las unidades básicas de texto que procesan los modelos. Los modelos con razonamiento habilitado requirieron un promedio de 543,5 tokens de "pensamiento" adicionales por pregunta en el modo de opción múltiple, mientras que en respuesta libre este número aumentó a 859,2 tokens promedio.

El estudio documenta casos extremos de verbosidad en modelos de razonamiento. El Deepseek-R1 7B generó hasta 14.187 tokens en una sola pregunta matemática, mientras que modelos estándar produjeron respuestas de un solo token. El record lo estableció Cogito 8B con una respuesta de 37.575 tokens para una pregunta de Álgebra Abstracta.

Los investigadores encontraron que las capacidades de razonamiento aumentaron las emisiones entre 4 y 6 veces comparado con modelos estándar del mismo tamaño. Por ejemplo, Cogito 8B en modo razonamiento emitió 371,87 gramos frente a solo 56,30 gramos en su configuración predeterminada para el mismo conjunto de preguntas.

El análisis por escala de modelos muestra que los sistemas más grandes (70-72 mil millones de parámetros) consumieron uniformemente entre 100-700 gramos de CO₂ equivalente, mientras que los modelos compactos de 7-8 mil millones de parámetros se mantuvieron por debajo de 180 gramos en la fase de opción múltiple.

Los hallazgos destacan la necesidad urgente de desarrollar estrategias de razonamiento más eficientes en futuros modelos de IA, especialmente considerando que se estima que los modelos generativos consumen anualmente 29,3 TWh, comparable al consumo energético total de Irlanda.

Fuente: Frontiers in Artificial Intelligence

No hemos podido validar su suscripción.

Se ha realizado su suscripción.

Recibe el boletín de Iceebook

Las noticias más importantes del planeta, ciencia, espacio y tecnología, directamente en tu bandeja de entrada. Sin ruido, solo lo esencial.

Introduzca su dirección de e-mail para suscribirse

Al suscribirte, aceptas nuestra política de privacidad y nuestros términos y condiciones. Puedes darte de baja en cualquier momento a través del enlace incluido en nuestros correos.

Preguntas frecuentes

: 💬 Los modelos con razonamiento generan entre 4 y 6 veces más emisiones de CO₂ que sus versiones estándar del mismo tamaño debido a la generación adicional de tokens de "pensamiento".
: 💬 El modelo menos eficiente (Deepseek-R1 70B) emitió 2.042,4 gramos de CO₂ frente a los 27,7 gramos del más eficiente (Qwen 7B), una diferencia de 74 veces.
: 💬 Los dominios simbólicos y abstractos como Álgebra Abstracta demandan más computación y recursos, alcanzando solo 51,4% de precisión promedio comparado con 76,3% en Historia Universal.
: 💬 Sí, el modelo Cogito 70B con razonamiento logró la máxima precisión (84,9%) mientras emitía 34,3% menos CO₂ que otros modelos de razonamiento de tamaño similar.

Continúa informándote

Ciencia

Descubren el mecanismo cerebral que permite borrar información irrelevante de la memoria

Descubren cómo el cerebro borra información irrelevante para optimizar la memoria de trabajo y prevenir la sobrecarga mental

Batería de iones de sodio con aditivos de litio

Ciencia

Sal de litio transforma las baterías de iones de sodio y promete energía más barata a gran escala

La incorporación de sal de litio en las baterías de iones de sodio revoluciona la retención de capacidad y facilita un almacenamiento energético más económico y sostenible

Ciencia

Desarrollan baterías de estado sólido con una vida útil siete veces mayor

Avances recientes permiten que las baterías de estado sólido sean mucho más duraderas y seguras, acelerando su llegada a móviles y vehículos eléctricos

Ciencia

Beber café negro sin azúcar ni crema podría disminuir el riesgo de mortalidad en adultos

Un estudio de la Universidad de Tufts vincula el consumo de café negro, sin azúcar ni crema, con una reducción significativa del riesgo de muerte en adultos estadounidenses

Multitud en un centro urbano iluminado con luces comerciales y decorativas durante la noche

Ciencia

Revelan que la publicidad y las vitrinas superan en número al alumbrado en centros urbanos

La proliferación de luces publicitarias y escaparates en ciudades alemanas supera ampliamente a las farolas, según un análisis inédito de ciencia ciudadana

Continúa informándote

Tecnología

Modelos de IA con razonamiento mejoran la precisión pero incrementan emisiones de CO₂ significativamente

Estudio evalúa 14 modelos de lenguaje grandes y revela compensaciones entre rendimiento y sostenibilidad ambiental

Descubren el mecanismo cerebral que permite borrar información irrelevante de la memoria

Sal de litio transforma las baterías de iones de sodio y promete energía más barata a gran escala

Desarrollan baterías de estado sólido con una vida útil siete veces mayor

Beber café negro sin azúcar ni crema podría disminuir el riesgo de mortalidad en adultos

Revelan que la publicidad y las vitrinas superan en número al alumbrado en centros urbanos

Robots humanoides de Nvidia y Foxconn llegarán a la nueva fábrica de servidores de IA en Houston

La ciudad de Vitoria en alerta tras un incendio y explosiones en la emblemática fábrica LEA

Descubren cómo la materia orgánica de los incendios forestales altera la calidad del agua en ríos y lagos

Un nuevo avance revela cómo se formaron y crecieron las primeras estrellas que dieron luz al universo primitivo

Bruselas examina los cambios en la organización interna de X meses después del millonario acuerdo con xAI

Quemas controladas generan hasta 25% de contaminación atmosférica en regiones vulnerables

La compensación de emisiones de combustibles fósiles enfrenta límites ecológicos y financieros insuperables

Investigadores crean sistema para almacenar mensajes en burbujas de hielo

Confirman la presencia humana de 23,000 años de antigüedad en América del Norte durante la última glaciación

Científicos logran producir hidrógeno verde con enzimas artificiales más pequeñas y eficientes