Humanos superan a la inteligencia artificial en la comprensión de interacciones sociales en movimiento

Un estudio de Johns Hopkins revela que la IA aún no puede igualar la comprensión humana de interacciones sociales en escenas dinámicas

Autor - Aldo Venuta Rodríguez

3 min lectura

Comparativa visual entre percepción humana y análisis de modelos de IA ante escenas sociales dinámicas.
Ilustración conceptual que muestra cómo los humanos superan a los modelos de IA al interpretar interacciones sociales dinámicas, según un estudio de Johns Hopkins.

Aunque los modelos de inteligencia artificial han logrado grandes avances en tareas como el reconocimiento facial o la clasificación de imágenes, siguen quedándose cortos en una habilidad crucial para interactuar con humanos: interpretar correctamente las interacciones sociales en movimiento. Así lo demuestra un nuevo estudio de la Universidad Johns Hopkins, publicado el 24 de abril de 2025.

La investigación, liderada por la profesora Leyla Isik y presentada en la Conferencia Internacional sobre Representaciones de Aprendizaje, pone en evidencia que los humanos aún superan ampliamente a los modelos de IA cuando se trata de comprender las dinámicas sociales de una escena, un requisito esencial para tecnologías como vehículos autónomos, robots asistenciales y sistemas de vigilancia inteligente.

En el experimento, los científicos compararon las respuestas de personas y más de 350 modelos de IA ante videos de tres segundos que mostraban distintos tipos de interacciones humanas. Los participantes humanos calificaron aspectos sociales clave en una escala del uno al cinco. En contraste, los modelos de IA —de lenguaje, video e imagen— no lograron predecir ni describir adecuadamente las interacciones mostradas.

“La IA necesita saber si dos personas están conversando o a punto de cruzar una calle. Pero nuestros hallazgos muestran que aún no pueden hacer eso con fiabilidad”, explicó Isik. El estudio reveló que los modelos de video fueron los menos precisos al describir la actividad social, mientras que los de lenguaje lograron mejores resultados al predecir la respuesta humana.

Publicidad

La coautora Kathy García, quien presentó los resultados, destacó que los modelos actuales están basados en redes neuronales inspiradas en zonas del cerebro que procesan imágenes estáticas, no en las regiones que interpretan escenas dinámicas. Esto podría estar limitando su capacidad de comprender historias visuales complejas.

El estudio sugiere que, si bien la IA ha progresado en el reconocimiento de imágenes fijas, interpretar escenas sociales requiere una arquitectura cognitiva más compleja. "Comprender relaciones y contexto en movimiento es una habilidad que la IA aún no domina", afirmó García.

Los investigadores concluyen que para lograr una verdadera inteligencia social artificial, los sistemas deben integrar capacidades similares a las del cerebro humano en lo que respecta al procesamiento de escenas dinámicas. Este hallazgo plantea nuevos desafíos y oportunidades en el diseño de futuras arquitecturas de IA que convivan con seres humanos.

Referencias: Universidad Johns Hopkins

Publicidad

Continúa informándote

Centro de datos futurista con chips de IA estilizados y paneles holográficos conectando servidores en tonos azules y violetas
Tecnología

Amazon impulsa su ofensiva en IA con nuevos chips, servidores más potentes y Fábricas de IA híbridas

Amazon acelera su estrategia en IA con nuevos chips Trainium, servidores más potentes y Fábricas de IA híbridas creadas junto a Nvidia para empresas y gobiernos

Ingeniero realizando una prueba de escucha sobre un vehículo eléctrico en un entorno de análisis acústico
Tecnología

Diseñan un sonido más eficaz para alertar del paso de vehículos eléctricos

Un estudio identifica un sonido de baja frecuencia que mejora la detección de vehículos eléctricos y podría reducir accidentes en entornos urbanos

Paneles de IA con Qwen y deepseek sobre fondo de circuitos en tonos rojos y azules
Tecnología

China se impone en el mercado global de IA de código abierto gracias a modelos como DeepSeek y Qwen

China supera a Estados Unidos en la IA de código abierto gracias al auge de modelos como DeepSeek y Qwen, que ya lideran las descargas globales según un estudio del MIT y Hugging Face

Smartphone con un icono de bloqueo en pantalla y la silueta difuminada de un menor al fondo
Tecnología

YouTube cumplirá la prohibición australiana y bloqueará las cuentas de menores de 16 años

YouTube aplicará la nueva ley australiana que prohíbe cuentas a menores de 16 años y cerrará sesiones a cientos de miles de adolescentes, en un cambio sin precedentes en redes sociales

MacBook con el logo iluminado sobre una mesa
Tecnología

Tras la renuncia de Giannandrea, Apple apuesta por un veterano de Google y Microsoft para liderar su IA

Apple reemplaza a John Giannandrea y nombra como nuevo jefe de IA a Amar Subramanya, un ejecutivo con larga experiencia en Google y Microsoft, en plena crisis interna por Apple Intelligence

Escritorio con cámara, móvil y laptop desde la que emergen flujos luminosos que generan imágenes y vídeos de forma automática
Tecnología

¿Peligra el trabajo de los creadores con la llegada de la IA a las redes sociales?

La inteligencia artificial ya crea textos, imágenes y vídeos en redes sociales y obliga a los creadores a competir con contenido automático mientras buscan cómo proteger su trabajo y su identidad