Desarrollan "traductor universal" que permite comunicación entre modelos de IA diferentes

Investigadores del Instituto Weizmann e Intel Labs han desarrollado algoritmos revolucionarios que permiten a diferentes modelos de IA comunicarse y colaborar por primera vez, acelerando su rendimiento hasta 2,8 veces.

4 min lectura

Autor - Aldo Venuta Rodríguez

Ilustración conceptual
Imagen ilustrativa. Créditos: Iceebook

El problema de la incomunicación entre modelos de IA

Así como las personas de diferentes países hablan distintos idiomas, los modelos de IA también crean diversos "lenguajes" internos: un conjunto único de tokens que solo entiende cada modelo. Hasta ahora, los modelos desarrollados por diferentes empresas no podían comunicarse directamente, colaborar ni combinar sus fortalezas para mejorar su rendimiento.

Los modelos de aprendizaje profundo como ChatGPT y Gemini son herramientas potentes, pero presentan importantes inconvenientes: son lentos y consumen mucha potencia de procesamiento. En 2022, las principales empresas tecnológicas desarrollaron un método llamado decodificación especulativa, donde un modelo pequeño y rápido realiza una primera suposición al responder consultas, y un modelo más grande revisa y corrige la respuesta si es necesario.

Sin embargo, la decodificación especulativa tenía una gran limitación: ambos modelos debían "hablar" el mismo lenguaje digital, lo que significaba que los modelos desarrollados por diferentes empresas no podían combinarse. Solo los gigantes tecnológicos podían beneficiarse porque tenían acceso a modelos pequeños y grandes que compartían el mismo lenguaje interno.

"En cambio, una startup que buscaba beneficiarse de la decodificación especulativa tenía que entrenar su propio modelo pequeño que se ajustara al lenguaje del modelo grande, lo cual requiere una gran experiencia y costosos recursos computacionales", explica Nadav Timor, estudiante de doctorado que dirigió el desarrollo.

La solución: algoritmos de traducción universal

Para superar la barrera del idioma, los investigadores idearon dos soluciones innovadoras. Primero, diseñaron un algoritmo que permite a un modelo de IA traducir su salida desde su lenguaje de tokens interno a un formato compartido que todos los modelos pueden comprender.

En segundo lugar, crearon otro algoritmo que impulsa a dichos modelos a basarse principalmente en tokens que tienen el mismo significado en todos los modelos, de forma similar a palabras como "banana" o "internet", que son casi idénticas en todos los lenguajes humanos.

"Al principio, nos preocupaba que se perdiera demasiada información en la traducción y que los diferentes modelos no pudieran colaborar eficazmente", afirma Timor. "Pero nos equivocamos. Nuestros algoritmos aceleran el rendimiento de los LLM hasta 2,8 veces, lo que se traduce en un ahorro considerable en potencia de procesamiento".

Impacto y adopción mundial

La importancia de esta investigación ha sido reconocida por los organizadores de la Conferencia Internacional sobre Aprendizaje Automático (ICML), quienes seleccionaron el estudio para su presentación pública, una distinción otorgada solo a alrededor del 1% de las 15.000 propuestas recibidas este año.

En los últimos meses, el equipo publicó sus algoritmos en la plataforma de IA de código abierto Hugging Face Transformers, poniéndolos a disposición de desarrolladores de todo el mundo. Desde entonces, los algoritmos se han convertido en herramientas estándar para ejecutar procesos de IA eficientes.

Los nuevos algoritmos aceleran el rendimiento de los grandes modelos de lenguaje en 1,5 veces en promedio, permitiendo a los desarrolladores de IA combinar el poder de diferentes modelos que ahora pueden "pensar" como uno solo.

"Hemos solucionado una ineficiencia fundamental de la IA generativa", afirma Oren Pereg, investigador sénior de Intel Labs. "No se trata solo de una mejora teórica; se trata de herramientas prácticas que ya están ayudando a los desarrolladores a crear aplicaciones más rápidas e inteligentes".

Los gigantes tecnológicos que adoptaron la decodificación especulativa original se beneficiaron de un rendimiento más rápido y ahorraron miles de millones de dólares al año en costos de procesamiento, pero ahora esta tecnología está disponible para cualquier desarrollador.

Aplicaciones en dispositivos del futuro

Este desarrollo es especialmente importante para los dispositivos periféricos, desde teléfonos y drones hasta coches autónomos, que deben depender de una potencia de cálculo limitada cuando no están conectados a internet.

"Imagine, por ejemplo, un coche autónomo guiado por un modelo de IA. En este caso, un modelo más rápido puede marcar la diferencia entre una decisión segura y un error peligroso", añade Timor sobre las aplicaciones críticas de la tecnología.

Fuente: Instituto Weizmann de Ciencias

No hemos podido validar su suscripción.
Se ha realizado su suscripción.

Recibe el boletín de Iceebook

Las noticias más importantes del planeta, ciencia, espacio y tecnología, directamente en tu bandeja de entrada. Sin ruido, solo lo esencial.

Preguntas frecuentes

💬 Es un método donde un modelo pequeño y rápido hace una suposición inicial, y un modelo grande la revisa. Mantiene 100% de precisión mientras acelera el proceso, ahorrando miles de millones en costos.
💬 Usa dos algoritmos: uno traduce tokens internos a un formato compartido, y otro enfoca la colaboración en tokens con significado universal entre modelos.
💬 Los algoritmos aceleran el rendimiento hasta 2,8 veces en casos óptimos, con un promedio de 1,5 veces de mejora en grandes modelos de lenguaje.
💬 Especialmente útil en dispositivos periféricos como teléfonos, drones y coches autónomos que tienen potencia de cálculo limitada cuando no están conectados a internet.

Continúa informándote

Perro sentado frente a un televisor encendido en una sala de estar
Ciencia

Estudio revela cómo los perros ven televisión y qué programas prefieren según su personalidad

Investigación con 453 perros desarrolla primera escala científica para medir hábitos televisivos caninos y encuentra que 88% responde a estímulos

Paneles solares modernos instalados al aire libre bajo un cielo azul con algunas nubes
Tecnología

Empresa española Zelestra invertirá 1.000 millones en energía renovable para minas de Perú

Compañía propiedad de firma sueca EQT planea generar 1 GW de energía limpia en cinco años para abastecer sector cuprífico del sur peruano

Álamos temblones y coníferas calcinadas tras incendio en Colorado.
Ciencia

Álamos pueden actuar como cortafuegos naturales contra incendios forestales

Estudio de 20 años con más de 300 incendios revela que bosques de álamos reducen un tercio la velocidad de propagación del fuego

Entrada de la cueva de Amud
Ciencia

Primeras pruebas de tradiciones culinarias neandertales encontradas en cuevas de Israel

Grupos de Amud y Kebara procesaban carne de maneras distintivas hace 60.000 años, sugiriendo transmisión cultural de técnicas gastronómicas

Colaboración entre el Laboratorio Nacional de Idaho y Microsoft para licencias nucleares.
Tecnología

Colaboración Microsoft-Idaho busca agilizar licencias nucleares con tecnología Azure

IA automatizará la generación de informes de seguridad requeridos por la Comisión Reguladora Nuclear de Estados Unidos

Mark Zuckerberg
Tecnología

Meta y Zuckerberg evitan el juicio de 8.000 millones de dólares por violaciones de privacidad de Facebook con un acuerdo confidencial

Accionistas demandaron al CEO y directivos por permitir violaciones que resultaron en multa récord de la FTC tras escándalo Cambridge Analytica

Equipo experimental para producción de hidrógeno con aguas residuales y energía solar
Ciencia

Aguas residuales contaminadas impulsan la producción de hidrógeno verde

Innovación de Universidad RMIT aprovecha metales como platino, cromo y níquel presentes en desechos para acelerar la generación de combustible limpio

Dispositivo de enfriamiento
Tecnología

Crean sistema de enfriamiento sin compresores que duplica la eficiencia del aire acondicionado

Tecnología CHESS del Laboratorio Johns Hopkins enfría el doble consumiendo solo la mitad de electricidad

Dos osos
Ciencia

Por qué algunos animales luchan hasta la muerte

Nuevo estudio revela vacíos críticos en décadas de investigación sobre los verdaderos costos de las peleas entre especies

Enlaces de celosía autoensamblados en forma de tetraedro
Tecnología

"Metabolismo Robótico": robots que crecen, se curan y mejoran físicamente

Universidad de Columbia desarrolla robots capaces de absorber y reutilizar partes de otros robots o del entorno para crecer y adaptarse