Publicidad

Humanos superan a la inteligencia artificial en la comprensión de interacciones sociales en movimiento

Un estudio de Johns Hopkins revela que la IA aún no puede igualar la comprensión humana de interacciones sociales en escenas dinámicas

Comparativa visual entre percepción humana y análisis de modelos de IA ante escenas sociales dinámicas.
Ilustración conceptual que muestra cómo los humanos superan a los modelos de IA al interpretar interacciones sociales dinámicas, según un estudio de Johns Hopkins.

Aunque los modelos de inteligencia artificial han logrado grandes avances en tareas como el reconocimiento facial o la clasificación de imágenes, siguen quedándose cortos en una habilidad crucial para interactuar con humanos: interpretar correctamente las interacciones sociales en movimiento. Así lo demuestra un nuevo estudio de la Universidad Johns Hopkins, publicado el 24 de abril de 2025.

La investigación, liderada por la profesora Leyla Isik y presentada en la Conferencia Internacional sobre Representaciones de Aprendizaje, pone en evidencia que los humanos aún superan ampliamente a los modelos de IA cuando se trata de comprender las dinámicas sociales de una escena, un requisito esencial para tecnologías como vehículos autónomos, robots asistenciales y sistemas de vigilancia inteligente.

En el experimento, los científicos compararon las respuestas de personas y más de 350 modelos de IA ante videos de tres segundos que mostraban distintos tipos de interacciones humanas. Los participantes humanos calificaron aspectos sociales clave en una escala del uno al cinco. En contraste, los modelos de IA —de lenguaje, video e imagen— no lograron predecir ni describir adecuadamente las interacciones mostradas.

“La IA necesita saber si dos personas están conversando o a punto de cruzar una calle. Pero nuestros hallazgos muestran que aún no pueden hacer eso con fiabilidad”, explicó Isik. El estudio reveló que los modelos de video fueron los menos precisos al describir la actividad social, mientras que los de lenguaje lograron mejores resultados al predecir la respuesta humana.

Publicidad

La coautora Kathy García, quien presentó los resultados, destacó que los modelos actuales están basados en redes neuronales inspiradas en zonas del cerebro que procesan imágenes estáticas, no en las regiones que interpretan escenas dinámicas. Esto podría estar limitando su capacidad de comprender historias visuales complejas.

El estudio sugiere que, si bien la IA ha progresado en el reconocimiento de imágenes fijas, interpretar escenas sociales requiere una arquitectura cognitiva más compleja. "Comprender relaciones y contexto en movimiento es una habilidad que la IA aún no domina", afirmó García.

Los investigadores concluyen que para lograr una verdadera inteligencia social artificial, los sistemas deben integrar capacidades similares a las del cerebro humano en lo que respecta al procesamiento de escenas dinámicas. Este hallazgo plantea nuevos desafíos y oportunidades en el diseño de futuras arquitecturas de IA que convivan con seres humanos.

Referencias: Universidad Johns Hopkins

Publicidad

❓ Preguntas frecuentes

Que la IA aún no puede interpretar interacciones sociales como lo hacen los humanos.

Más de 350 modelos de IA de lenguaje, imagen y video fueron puestos a prueba.

Porque su arquitectura está basada en el procesamiento de imágenes fijas, no de contexto social.

Sugiere que la IA debe mejorar en la comprensión del comportamiento humano en movimiento.

Continúa informándote

Evolución humana de lo primitivo a lo cultural y tecnológico
Ciencia

¿Genes o cultura? Científicos plantean que la evolución humana ahora depende de nuestras sociedades

Investigadores de la Universidad de Maine sostienen que la cultura ha superado a la genética como la principal fuerza que impulsa la evolución humana, según un artículo en BioScience

Vista lateral del insecto Heinrichiellus natgeo con sus alas extendidas y antenas curvas
Ciencia

Tres nuevas avispas parasitoides descubiertas en Asia, una especie nombrada en honor a National Geographic

Investigadores describen tres especies inéditas de avispas parasitoides en Asia y rinden homenaje a National Geographic al bautizar a una de ellas con su nombre

Lingote plano-convexo de la Edad del Hierro visto desde arriba y de perfil
El Mundo

Descubren en Suecia un raro lingote de la Edad del Hierro tras más de un siglo de misterio arqueológico

Un lingote de la Edad del Hierro hallado en Särdal, Suecia, revela conexiones bálticas gracias a análisis químicos y colaboración internacional

Paisaje verde en la región del Congo con montañas al fondo y cielo nublado
Medio Ambiente

Turberas ocultas en la cuenca del Congo almacenan 30 mil millones de toneladas de carbono

Científicos confirman que las turberas del Congo guardan más de 30 mil millones de toneladas de carbono, un depósito clave en la lucha contra el cambio climático

Representación artística de un agujero negro giratorio y resonante
Espacio

Ondas gravitacionales confirman el teorema del área de Stephen Hawking tras diez años de investigaciones

Un estudio del Observatorio Gravitacional Europeo verifica el teorema del área de Stephen Hawking con ondas gravitacionales de la fusión GW250114