La aplicación, llamada Google AI Edge Eloquent, ha sido lanzada discretamente para iOS y se suma a una nueva generación de herramientas que van más allá de la transcripción básica. Una vez descargados los modelos de reconocimiento de voz basados en Gemma, el usuario puede dictar sin conexión y ver el texto en tiempo real.
El funcionamiento introduce un cambio relevante frente a los sistemas tradicionales. En lugar de limitarse a transcribir palabra por palabra, la aplicación elimina muletillas como “eh” o “ah”, corrige interrupciones y genera un texto más limpio, acercándose a una redacción lista para usar.
Este enfoque convierte el dictado en un proceso más cercano a la escritura asistida que a la simple conversión de voz a texto. La herramienta no solo captura lo que se dice, sino que intenta interpretar la intención del usuario para producir un resultado más claro.
El control sobre el procesamiento es otro de los elementos clave. La aplicación permite trabajar completamente en local, sin enviar datos a la nube, aunque también ofrece un modo opcional que utiliza modelos Gemini para mejorar el resultado cuando se activa la conexión.
Además, incorpora opciones para transformar el texto generado. El usuario puede elegir entre distintos estilos como “Formal”, “Corto”, “Largo” o “Puntos clave”, lo que permite adaptar el contenido sin necesidad de editarlo manualmente.
La personalización también juega un papel importante. La aplicación puede importar nombres, términos o jerga desde la cuenta de Gmail del usuario, y permite añadir vocabulario propio, lo que mejora la precisión en contextos específicos.
A nivel funcional, incluye historial de sesiones, métricas como velocidad de palabras por minuto y búsqueda dentro de transcripciones anteriores, lo que apunta a un uso continuado más que puntual.
Por ahora, Google AI Edge Eloquent está disponible solo en iOS, aunque la propia descripción anticipa una versión para Android con integración más profunda en el sistema, incluyendo su uso como teclado y acceso desde cualquier campo de texto.
El lanzamiento refleja cómo las aplicaciones de dictado están evolucionando hacia sistemas que no solo transcriben, sino que reescriben y estructuran el lenguaje. La diferencia ya no está solo en reconocer la voz, sino en convertirla en texto utilizable sin pasos intermedios.