Humanos superan a la inteligencia artificial en la comprensión de interacciones sociales en movimiento
Un estudio de Johns Hopkins revela que la IA aún no puede igualar la comprensión humana de interacciones sociales en escenas dinámicas
Autor - Aldo Venuta Rodríguez
3 min lectura
Aunque los modelos de inteligencia artificial han logrado grandes avances en tareas como el reconocimiento facial o la clasificación de imágenes, siguen quedándose cortos en una habilidad crucial para interactuar con humanos: interpretar correctamente las interacciones sociales en movimiento. Así lo demuestra un nuevo estudio de la Universidad Johns Hopkins, publicado el 24 de abril de 2025.
La investigación, liderada por la profesora Leyla Isik y presentada en la Conferencia Internacional sobre Representaciones de Aprendizaje, pone en evidencia que los humanos aún superan ampliamente a los modelos de IA cuando se trata de comprender las dinámicas sociales de una escena, un requisito esencial para tecnologías como vehículos autónomos, robots asistenciales y sistemas de vigilancia inteligente.
En el experimento, los científicos compararon las respuestas de personas y más de 350 modelos de IA ante videos de tres segundos que mostraban distintos tipos de interacciones humanas. Los participantes humanos calificaron aspectos sociales clave en una escala del uno al cinco. En contraste, los modelos de IA —de lenguaje, video e imagen— no lograron predecir ni describir adecuadamente las interacciones mostradas.
“La IA necesita saber si dos personas están conversando o a punto de cruzar una calle. Pero nuestros hallazgos muestran que aún no pueden hacer eso con fiabilidad”, explicó Isik. El estudio reveló que los modelos de video fueron los menos precisos al describir la actividad social, mientras que los de lenguaje lograron mejores resultados al predecir la respuesta humana.
La coautora Kathy García, quien presentó los resultados, destacó que los modelos actuales están basados en redes neuronales inspiradas en zonas del cerebro que procesan imágenes estáticas, no en las regiones que interpretan escenas dinámicas. Esto podría estar limitando su capacidad de comprender historias visuales complejas.
El estudio sugiere que, si bien la IA ha progresado en el reconocimiento de imágenes fijas, interpretar escenas sociales requiere una arquitectura cognitiva más compleja. "Comprender relaciones y contexto en movimiento es una habilidad que la IA aún no domina", afirmó García.
Los investigadores concluyen que para lograr una verdadera inteligencia social artificial, los sistemas deben integrar capacidades similares a las del cerebro humano en lo que respecta al procesamiento de escenas dinámicas. Este hallazgo plantea nuevos desafíos y oportunidades en el diseño de futuras arquitecturas de IA que convivan con seres humanos.
Referencias: Universidad Johns Hopkins
Continúa informándote
La startup italiana Generative Bionics recauda 70 millones para lanzar una nueva generación de robots humanoides
Generative Bionics, la nueva startup del IIT, recauda 70 millones de euros para desarrollar robots humanoides inteligentes “Made in Italy” y llevarlos a entornos industriales reales
Adobe se integra con ChatGPT: Photoshop y Acrobat ahora pueden usarse gratis desde el chatbot
Adobe integra Photoshop, Acrobat y Express en ChatGPT, permitiendo editar imágenes y PDFs gratis y directamente desde el chatbot con una simple instrucción
Por qué la lucha contra la desinformación se nos está escapando de las manos
La desinformación crece sin freno y supera todos los esfuerzos por controlarla, en un mundo donde la tecnología acelera el engaño y la verdad queda rezagada
Google lanza en India su plan AI Plus con Gemini 3 Pro y 200 GB de nube por solo 199 rupias
Google lanza en India su plan AI Plus por 199 rupias al mes con acceso a Gemini 3 Pro, creación de imágenes y 200 GB de almacenamiento en la nube, buscando competir con ChatGPT Go
Entra en vigor en Australia la primera prohibición global del uso de redes sociales por menores de 16
Australia aplica la primera prohibición mundial que impide a los menores de 16 años usar redes sociales, obligando a las plataformas a bloquear el acceso y marcando un precedente global
Presentan un implante cerebral del tamaño de un chip que supera en velocidad y precisión a los dispositivos actuales
Un nuevo implante cerebral ultrafino del tamaño de un chip ofrece una velocidad y precisión sin precedentes, marcando un salto en tratamientos neurológicos y conexión con tecnología