Los chatbots de IA exageran sistemáticamente los hallazgos científicos, según un estudio internacional

Un análisis de casi 5.000 resúmenes revela que modelos como ChatGPT y DeepSeek generalizan en exceso los resultados de investigaciones científicas

Un análisis de casi 5.000 resúmenes revela que modelos como ChatGPT y DeepSeek generalizan en exceso los resultados de investigaciones científicas

2 min lectura

Autor - Aldo Venuta Rodríguez

Grupos de personas intercambiando información representada por figuras y una página central con datos en líneas rectas
Ilustración sobre la circulación de datos e información entre grupos sociales y una página central. Crédito: Yasmine Boudiaf y LOTI / betterimagesofai.org / CC BY 4.0.

Los modelos de lenguaje como ChatGPT, DeepSeek y Claude están transformando la manera en que se accede a la información científica, pero un nuevo estudio advierte que estos sistemas de IA exageran rutinariamente los hallazgos de los estudios que resumen. La investigación, liderada por el Dr. Uwe Peters de la Universidad de Utrecht y el Dr. Benjamin Chin-Yee, evaluó 4.900 resúmenes generados por 10 modelos de lenguaje masivo (LLM) y encontró que seis de ellos incurrieron en generalizaciones excesivas en la mayoría de los casos.

El análisis incluyó resúmenes de artículos científicos de alto impacto publicados en revistas como Nature, Science y Lancet. Los modelos tendían a convertir frases cautelosas como “el tratamiento fue eficaz en este estudio” en afirmaciones absolutas como “el tratamiento es eficaz”, ampliando erróneamente el alcance de los resultados originales.

Paradójicamente, cuando se les pidió expresamente que evitaran inexactitudes, algunos modelos generaron aún más exageraciones. “Esto es preocupante”, señaló Peters, “porque sugiere que los usuarios podrían confiar más en resúmenes que en realidad son menos precisos cuando se intenta mejorar su fidelidad”.

Los investigadores también compararon estos resúmenes con versiones escritas por humanos. Los chatbots presentaron una probabilidad casi cinco veces mayor de exagerar las conclusiones científicas. Los modelos más nuevos, como ChatGPT-4o y DeepSeek, resultaron menos precisos que versiones anteriores, desafiando la noción de que las mejoras técnicas implican mayor rigor.

El estudio destaca que este comportamiento puede estar vinculado a los propios datos de entrenamiento: “Las generalizaciones excesivas ya son comunes en la escritura científica, y los modelos podrían estar reproduciendo ese sesgo”, explicó Chin-Yee. Además, los usuarios podrían fomentar sin querer estas exageraciones al preferir respuestas más amplias o contundentes.

Para reducir estos riesgos, los autores recomiendan usar modelos como Claude, que mostró mejores niveles de precisión, así como ajustar la temperatura de los LLM (parámetro que regula la creatividad) y fomentar el uso de tiempo pasado y lenguaje indirecto en los resúmenes generados.

“Si queremos que la inteligencia artificial potencie la alfabetización científica y no la debilite, necesitamos implementar evaluaciones de precisión rigurosas en estos sistemas”, concluyó Peters. El artículo completo se encuentra publicado en Royal Society Open Science.

Referencias: Royal Society Open Science

No hemos podido validar su suscripción.
Se ha realizado su suscripción.

Recibe el boletín de Iceebook

Las noticias más importantes del planeta, ciencia, espacio y tecnología, directamente en tu bandeja de entrada. Sin ruido, solo lo esencial.

Preguntas frecuentes

💬 Que suelen exagerar los hallazgos científicos al generar resúmenes de investigaciones.
💬 Se evaluaron diez modelos, incluidos ChatGPT-4o, DeepSeek, Claude y LLaMA.
💬 No siempre; los modelos más nuevos mostraron más errores que versiones anteriores.
💬 Usando modelos más precisos, bajando la temperatura y optando por lenguaje en pasado.

Continúa informándote

El primer ministro británico, Keir Starmer, llega a la Cumbre Reino Unido-UE en Lancaster House
El Mundo

Gran Bretaña y la UE avanzan juntos hacia una cooperación renovada en comercio y defensa

El Reino Unido y la UE eliminan barreras comerciales y avanzan en defensa, marcando el mayor acercamiento desde el Brexit

Capa de hielo de Langjökull, Islandia
Planeta Tierra

Los glaciares no se recuperarán en siglos aunque se revierta el calentamiento global

Un estudio en Nature Climate Change concluye que los glaciares tardarían siglos en recuperarse, incluso si la temperatura global regresa al límite de 1,5 °C

Oscuras franjas de pendiente en Marte observadas por la cámara CaSSIS del Orbitador de Gases Traza ExoMars de la ESA
Espacio

Desmienten la presencia de agua líquida en Marte: avalanchas secas son la verdadera causa de las rayas oscuras

Un nuevo estudio publicado en Nature Communications revela que las vetas de pendiente marcianas son producto de avalanchas secas de polvo, no de flujos de agua líquida

Robot social humanoide en laboratorio
Tecnología

Robots sociales ya aprenden a interactuar sin humanos: nuevo método revoluciona su entrenamiento

Un estudio liderado por la Universidad de Surrey presenta una técnica de simulación que permite a los robots sociales aprender y ser evaluados sin la presencia de humanos

Representación artística del posible Planeta 10 en el Cinturón de Kuiper
Espacio

Un posible Planeta 10 en el Cinturón de Kuiper revoluciona la búsqueda de nuevos mundos en el Sistema Solar

Un nuevo cuerpo celeste estaría alterando órbitas en el Cinturón de Kuiper. La NASA ya lo estudia como posible Planeta 10

Herramientas de piedra antiguas encontradas en la selva de Costa de Marfil
Ciencia

Descubrimiento en la selva de Costa de Marfil reescribe el origen del Homo sapiens

Un hallazgo en Costa de Marfil revela herramientas humanas de hace 150.000 años y cambia la historia del Homo sapiens

Observatorio astronómico
Espacio

Detectan un objeto con densidad imposible: podría ser una nave interestelar según el Proyecto Galileo

Un objeto anómalo encendió las alarmas del Proyecto Galileo. Harvard busca confirmar si se trata de una sonda interestelar.

Plasma
Tecnología

Plasma de partículas de agua: la clave para una minería sostenible y el futuro del níquel mundial

Un nuevo método desarrollado en Alemania podría revolucionar la extracción de níquel y reducir drásticamente las emisiones de CO₂ en la industria minera

Sistema MARVL
Espacio

La NASA crea un sistema de propulsión nuclear eléctrica que acortará a la mitad los viajes a Marte

La NASA desarrolla propulsores nucleares eléctricos ensamblados en órbita que reducirían los viajes a Marte a solo dos años

Jeff Bezos
El Mundo

Los 5 hábitos clave que diferencian a los emprendedores que triunfan

Descubre los hábitos que marcan la diferencia entre emprendedores exitosos y quienes no logran avanzar en sus proyectos