Ya existe una web para reportar los fallos y peligros de la inteligencia artificial

Hasta ahora, quien veía a un chatbot filtrar datos o dar instrucciones peligrosas no tenía un sitio claro donde avisar, y eso acaba de cambiar.

Aldo Venuta Rodríguez 3 min lectura

Seguir en Google

Se llama FLARE-AI y es una plataforma abierta y colaborativa para reportar y seguir los fallos de los sistemas de inteligencia artificial. Detrás hay un grupo de investigadores que quiere trasladar al mundo de la IA la lógica que la ciberseguridad lleva décadas usando para detectar y corregir vulnerabilidades de software.

Con la herramienta se puede señalar, por ejemplo, que un chatbot genera programas maliciosos, filtra información personal o alimenta delirios en un usuario, y esos avisos se encaminan a los creadores del modelo y a entidades como MITRE. La impulsan investigadores del MIT y Hugging Face con aportaciones de decenas de organizaciones.

Cómo funciona y por qué hacía falta

El sistema convierte cada fallo en un informe estandarizado que se puede enviar de un clic a quien corresponda, en vez de perderse en formularios dispersos. Al ser de código abierto, cualquiera puede verificarlo y reenviarlo. Sus autores lo comparan con Downdetector, la web que registra en tiempo real las caídas de aplicaciones.

La necesidad viene de un ecosistema roto. No existía una vía transparente y centralizada para avisar, cada empresa aplica sus propios criterios y muchos problemas quedan sin registrar. Además, los fallos de la IA van más allá de la seguridad y alcanzan los sesgos, la desinformación o el daño psicológico, recuerda el investigador Avijit Ghosh.

Los ejemplos recientes no faltan. Esta semana se reveló una forma de engañar a navegadores con IA, como Atlas de OpenAI o Comet de Perplexity, para que saltaran sus propias protecciones. Otro investigador logró emitir entradas para festivales como Lollapalooza sin autorización usando Claude, de Anthropic, y el año pasado OpenAI corrigió modelos demasiado aduladores que rozaban el delirio.

De la web comunitaria a una ley federal

La iniciativa llega en paralelo a un empujón político. En junio, un proyecto bipartidista de los representantes Ross, Hurd y Beyer propuso que el instituto NIST cree un programa voluntario y una base de datos nacional de fallos de IA, calcada del catálogo que ya existe para las vulnerabilidades de software.

Conviene moderar el entusiasmo. No es el primer intento, porque ya existían registros como la AI Incident Database, y voces como la de Rumman Chowdhury advierten de dos retos, gestionar una avalancha de avisos poco graves y sostener el sistema con organismos creíbles. A ello se suma que muchos daños difusos no se arreglan con un simple parche.

Ya existe una web para reportar los fallos y peligros de la inteligencia artificial

Cómo funciona y por qué hacía falta

De la web comunitaria a una ley federal

Continúa informándote

Familias de América Latina se unen para quitarles el móvil a sus hijos

El verdadero coste climático de la IA aflora en los informes de Google y Amazon

"El ritmo no se frena y el poder se concentra", el aviso de la ONU sobre una IA sin control

El supuesto "teléfono con IA" de SpaceX que Elon Musk se apresura a desmentir

Claude Fable 5 regresa en todo el mundo tras casi tres semanas bloqueada por el Gobierno de EE.UU.

Australia duplica las multas a las redes sociales que dejen entrar a menores de 16 años

Más de Iceebook

Un niño muere de rabia por un murciélago pese a no tener ninguna mordedura visible

Proponen un "muro" de plasma alrededor de la Tierra para frenar las tormentas solares más peligrosas

Los glaciares "sucios" cubiertos de piedras resisten el calentamiento mejor que el hielo limpio

Las montañas explican por qué la Antártida se congeló antes que el Ártico

El plan para alterar el cielo y enfriar la Tierra que podría desatar el próximo conflicto global

Descubren cómo perdieron los dinosaurios su larga cola para convertirse en aves