Estudio revela que la inteligencia artificial solo simula comprensión, no entiende realmente lo que dice

Un equipo internacional advierte que los modelos de IA aciertan en definiciones, pero fallan al aplicar conceptos y solo aparentan comprender el significado real

3 min lectura

Autor - Aldo Venuta Rodríguez

IA
Imagen ilustrativa. Créditos: Iceebook

Un reciente estudio llevado a cabo por científicos del MIT, Harvard y la Universidad de Chicago ha sacudido los cimientos de la percepción pública sobre la inteligencia artificial. Si bien modelos avanzados como GPT-4o, Claude 3.5 y Llama 3.3 se destacan por su fluidez y precisión, los investigadores han descubierto que estas IA solo simulan entender el lenguaje, sin una comprensión genuina detrás de sus respuestas.

Los experimentos evaluaron a los principales modelos de IA en tareas que iban más allá de la simple definición de conceptos. En áreas como técnicas literarias, teoría de juegos y sesgos cognitivos, la IA logró definir correctamente los términos en el 94% de los casos. Sin embargo, al enfrentarse a la aplicación práctica de ese conocimiento, los modelos fallaron en más del 55% de las ocasiones, dejando al descubierto una brecha significativa entre lo que parecen saber y lo que realmente comprenden.

Este fenómeno ha sido bautizado como “comprensión potemkin”, una referencia a las aldeas ficticias creadas para impresionar superficialmente sin mostrar la realidad. Los autores del estudio advierten que, al igual que esas aldeas, la IA ofrece una fachada de coherencia conceptual, pero en realidad carece de una representación interna y funcional de los conceptos con los que trabaja.

La investigación pone en cuestión la validez de los métodos tradicionales de evaluación de IA, conocidos como benchmarks, que han sido diseñados para medir el rendimiento humano. Los expertos afirman que los buenos resultados de la IA en estos tests pueden ser engañosos, ya que lo que parece comprensión es, en muchos casos, una ilusión de competencia construida a partir de patrones y correlaciones aprendidas.

Keyon Vafa, uno de los coautores del estudio, destaca la urgencia de repensar las formas en que se evalúa la inteligencia artificial. “Necesitamos herramientas nuevas para medir la comprensión real de los modelos, porque las actuales pueden sobrevalorar capacidades que en realidad no existen”, subrayó el investigador. La comunidad científica reconoce que este hallazgo podría transformar la manera en que se desarrolla y prueba la IA en el futuro próximo.

El estudio será presentado en la próxima Conferencia Internacional sobre Aprendizaje Automático y ya ha provocado un intenso debate en la industria tecnológica. Empresas como OpenAI, Anthropic y Google, responsables de varios de los modelos evaluados, deberán enfrentar el reto de demostrar que sus sistemas no solo imitan inteligencia, sino que también pueden alcanzar formas más profundas de entendimiento.

El debate sobre la comprensión real de la IA está lejos de cerrarse. Para usuarios, desarrolladores y responsables de políticas públicas, la gran pregunta es cómo garantizar que la inteligencia artificial no solo responda de manera convincente, sino que desarrolle capacidades de razonamiento y aplicación práctica más allá de la simulación. El desafío está abierto y las respuestas, de momento, siguen en construcción.

No hemos podido validar su suscripción.
Se ha realizado su suscripción.

Recibe el boletín de Iceebook

Las noticias más importantes del planeta, ciencia, espacio y tecnología, directamente en tu bandeja de entrada. Sin ruido, solo lo esencial.

Preguntas frecuentes

💬 Es una ilusión de entendimiento: la IA parece comprender conceptos, pero solo simula coherencia sin una comprensión real.
💬 Los investigadores sometieron a la IA a pruebas donde debía definir y aplicar conceptos; la IA acertó en definiciones, pero falló al aplicarlas.
💬 Porque cuestiona los métodos actuales para medir la inteligencia artificial y revela que pueden sobrevalorar sus capacidades reales.
💬 Desarrollar nuevas pruebas que midan la comprensión genuina en IA, no solo su capacidad para dar respuestas correctas.

Continúa informándote

El ROV Hércules
El Mundo

El Nautilus inicia la búsqueda de naufragios perdidos en el estrecho Iron Bottom

El buque de exploración Nautilus lidera una misión internacional para localizar buques históricos hundidos en la campaña de Guadalcanal

Presa de las Tres Gargantas
Planeta Tierra

La NASA confirma que la presa de las Tres Gargantas en China ralentizó la rotación de la Tierra

La gigantesca infraestructura hidráulica china ha provocado un sutil pero real cambio en la duración de los días y el eje del planeta, según un estudio científico

Chantal
El Mundo

La tormenta tropical Chantal amenaza con lluvias intensas y riesgo de inundaciones en el sureste de EE.UU.

El sistema avanza lentamente hacia Carolina del Sur y Carolina del Norte, donde se esperan lluvias torrenciales, oleaje peligroso y marejadas durante el fin de semana

Balanza clásica con productos de consumo en un lado y billetes de dinero en el otro
Análisis

¿Es más eficaz tasar productos o salarios? Análisis comparativo de las políticas fiscales modernas

Analizamos ventajas y riesgos de gravar el consumo o el ingreso, comparando modelos fiscales para entender su impacto en la economía y la equidad social

Sonda SRL de Lockheed Martin
Espacio

Lockheed Martin propone una misión a Marte más eficiente y económica para el retorno de muestras

Lockheed Martin plantea a la NASA una solución innovadora y de precio fijo para traer a la Tierra muestras de Marte, prometiendo una drástica reducción de costos y mayor eficiencia operativa

Mapa estilizado de Japón
El Mundo

Autoridades japonesas alertan sobre sismos y desmienten rumores de catástrofe

El gobierno de Japón advierte sobre nuevos sismos en el suroeste del país, pero llama a la calma y desmiente predicciones alarmistas de desastre mayor

TikTok
Tecnología

Estados Unidos y China abrirán conversaciones sobre un posible acuerdo para TikTok esta semana

El gobierno de Estados Unidos abrirá esta semana conversaciones clave con China para lograr un acuerdo sobre el futuro de TikTok, según confirmó Donald Trump

Vista de la Tierra desde el espacio
Planeta Tierra

Días más cortos en julio y agosto desconciertan a científicos por fenómeno inexplicable

La aceleración inesperada de la rotación terrestre hará que los días sean más cortos en julio y agosto, sin que la ciencia tenga aún una explicación clara

Zona de baja presión y posible desarrollo del ciclón Gil
El Mundo

Autoridades emiten alerta por posible formación del ciclón Gil frente a las costas del Pacífico mexicano

Autoridades mexicanas y estadounidenses alertan sobre el posible desarrollo del ciclón Gil en el Pacífico; pronostican lluvias intensas y vigilancia especial en varios estados

Crecida violenta de un río
El Mundo

Inundaciones en el río Guadalupe dejan al menos 13 fallecidos y 23 menores desaparecidas en Texas

Las inundaciones repentinas del río Guadalupe han causado 13 muertes y la desaparición de 23 menores en un campamento de Texas; continúan las labores de rescate