Los chatbots de IA exageran sistemáticamente los hallazgos científicos, según un estudio internacional
Un análisis de casi 5.000 resúmenes revela que modelos como ChatGPT y DeepSeek generalizan en exceso los resultados de investigaciones científicas
2 min lectura
Autor - Aldo Venuta Rodríguez

Los modelos de lenguaje como ChatGPT, DeepSeek y Claude están transformando la manera en que se accede a la información científica, pero un nuevo estudio advierte que estos sistemas de IA exageran rutinariamente los hallazgos de los estudios que resumen. La investigación, liderada por el Dr. Uwe Peters de la Universidad de Utrecht y el Dr. Benjamin Chin-Yee, evaluó 4.900 resúmenes generados por 10 modelos de lenguaje masivo (LLM) y encontró que seis de ellos incurrieron en generalizaciones excesivas en la mayoría de los casos.
El análisis incluyó resúmenes de artículos científicos de alto impacto publicados en revistas como Nature, Science y Lancet. Los modelos tendían a convertir frases cautelosas como “el tratamiento fue eficaz en este estudio” en afirmaciones absolutas como “el tratamiento es eficaz”, ampliando erróneamente el alcance de los resultados originales.
Paradójicamente, cuando se les pidió expresamente que evitaran inexactitudes, algunos modelos generaron aún más exageraciones. “Esto es preocupante”, señaló Peters, “porque sugiere que los usuarios podrían confiar más en resúmenes que en realidad son menos precisos cuando se intenta mejorar su fidelidad”.
Los investigadores también compararon estos resúmenes con versiones escritas por humanos. Los chatbots presentaron una probabilidad casi cinco veces mayor de exagerar las conclusiones científicas. Los modelos más nuevos, como ChatGPT-4o y DeepSeek, resultaron menos precisos que versiones anteriores, desafiando la noción de que las mejoras técnicas implican mayor rigor.
El estudio destaca que este comportamiento puede estar vinculado a los propios datos de entrenamiento: “Las generalizaciones excesivas ya son comunes en la escritura científica, y los modelos podrían estar reproduciendo ese sesgo”, explicó Chin-Yee. Además, los usuarios podrían fomentar sin querer estas exageraciones al preferir respuestas más amplias o contundentes.
Para reducir estos riesgos, los autores recomiendan usar modelos como Claude, que mostró mejores niveles de precisión, así como ajustar la temperatura de los LLM (parámetro que regula la creatividad) y fomentar el uso de tiempo pasado y lenguaje indirecto en los resúmenes generados.
“Si queremos que la inteligencia artificial potencie la alfabetización científica y no la debilite, necesitamos implementar evaluaciones de precisión rigurosas en estos sistemas”, concluyó Peters. El artículo completo se encuentra publicado en Royal Society Open Science.
Referencias: Royal Society Open Science
Preguntas frecuentes
- 💬 Que suelen exagerar los hallazgos científicos al generar resúmenes de investigaciones.
- 💬 Se evaluaron diez modelos, incluidos ChatGPT-4o, DeepSeek, Claude y LLaMA.
- 💬 No siempre; los modelos más nuevos mostraron más errores que versiones anteriores.
- 💬 Usando modelos más precisos, bajando la temperatura y optando por lenguaje en pasado.
Continúa informándote

Inteligencia artificial revoluciona la gestión de desastres y la respuesta ante daños provocados por tornados
Investigadores de Texas A&M desarrollan un modelo de IA capaz de evaluar daños y estimar la recuperación tras tornados en solo una hora, facilitando respuestas rápidas

SWORD, el software de SwRI que revoluciona la programación robótica, brilla en Automate 2025
SwRI presenta SWORD™, una herramienta que integra CAD y ROS para automatizar procesos industriales sin necesidad de codificación experta

ETH descubre una nueva vulnerabilidad en procesadores Intel que expone la memoria a ataques especulativos
Una falla en el predictor de bifurcaciones permite leer la memoria de otros usuarios en la misma CPU, afectando a Intel desde 2018

OpenAI lanza GPT-4.1 para usuarios de pago con mejoras clave en codificación e instrucciones
GPT-4.1 llega a los usuarios de pago de ChatGPT con mejoras clave en codificación, manejo de contexto extenso y seguimiento de instrucciones, superando a modelos anteriores

Japón lanza un laboratorio autónomo que reinventa la ciencia de materiales con IA y robótica
Un nuevo laboratorio digital en Japón automatiza la síntesis y análisis de materiales con robots y aprendizaje automático
Continúa informándote

Gran Bretaña y la UE avanzan juntos hacia una cooperación renovada en comercio y defensa
El Reino Unido y la UE eliminan barreras comerciales y avanzan en defensa, marcando el mayor acercamiento desde el Brexit

Los glaciares no se recuperarán en siglos aunque se revierta el calentamiento global
Un estudio en Nature Climate Change concluye que los glaciares tardarían siglos en recuperarse, incluso si la temperatura global regresa al límite de 1,5 °C

Desmienten la presencia de agua líquida en Marte: avalanchas secas son la verdadera causa de las rayas oscuras
Un nuevo estudio publicado en Nature Communications revela que las vetas de pendiente marcianas son producto de avalanchas secas de polvo, no de flujos de agua líquida

Robots sociales ya aprenden a interactuar sin humanos: nuevo método revoluciona su entrenamiento
Un estudio liderado por la Universidad de Surrey presenta una técnica de simulación que permite a los robots sociales aprender y ser evaluados sin la presencia de humanos

Un posible Planeta 10 en el Cinturón de Kuiper revoluciona la búsqueda de nuevos mundos en el Sistema Solar
Un nuevo cuerpo celeste estaría alterando órbitas en el Cinturón de Kuiper. La NASA ya lo estudia como posible Planeta 10

Descubrimiento en la selva de Costa de Marfil reescribe el origen del Homo sapiens
Un hallazgo en Costa de Marfil revela herramientas humanas de hace 150.000 años y cambia la historia del Homo sapiens

Detectan un objeto con densidad imposible: podría ser una nave interestelar según el Proyecto Galileo
Un objeto anómalo encendió las alarmas del Proyecto Galileo. Harvard busca confirmar si se trata de una sonda interestelar.

Plasma de partículas de agua: la clave para una minería sostenible y el futuro del níquel mundial
Un nuevo método desarrollado en Alemania podría revolucionar la extracción de níquel y reducir drásticamente las emisiones de CO₂ en la industria minera

La NASA crea un sistema de propulsión nuclear eléctrica que acortará a la mitad los viajes a Marte
La NASA desarrolla propulsores nucleares eléctricos ensamblados en órbita que reducirían los viajes a Marte a solo dos años

Los 5 hábitos clave que diferencian a los emprendedores que triunfan
Descubre los hábitos que marcan la diferencia entre emprendedores exitosos y quienes no logran avanzar en sus proyectos