Google ha lanzado oficialmente AI Edge Eloquent, una nueva aplicación de dictado impulsada por IA para iOS diseñada para transformar la palabra hablada en texto pulido y profesional. A diferencia de las herramientas tradicionales de voz a texto que a menudo producen transcripciones desordenadas, esta aplicación aprovecha la inteligencia artificial del dispositivo para limpiar el habla en tiempo real.
Resolviendo el problema de las “palabras de relleno”
El principal desafío de la tecnología de dictado estándar siempre ha sido la brecha entre cómo hablamos los humanos y cómo escribimos. El habla natural suele ser confusa y está llena de:
– Vacaciones (p. ej., “um”, “uh”)
– Autocorrecciones (reiniciar una oración a mitad del pensamiento)
– Rellenos y pausas repetitivas
AI Edge Eloquent soluciona este problema utilizando los modelos Gemma en el dispositivo de Google. En lugar de simplemente transcribir cada sonido que capta el micrófono, la IA actúa como un editor automatizado. Identifica y elimina el desorden verbal, dejando al usuario con un bloque de texto limpio y coherente que requiere una edición manual mínima.
Privacidad y funcionalidad sin conexión
Una característica destacada de la aplicación es su capacidad de funcionar completamente fuera de línea. Al procesar modelos de lenguaje directamente en el iPhone en lugar de enviar datos de audio a un servidor remoto, Google ofrece dos ventajas importantes:
1. Privacidad: Las conversaciones confidenciales permanecen en el dispositivo, lo que reduce el riesgo de fuga de datos.
2. Confiabilidad: Los usuarios pueden dictar notas en entornos sin acceso a Internet, como durante vuelos o en áreas remotas.
Para los usuarios que desean aún más potencia, la aplicación ofrece conectividad en la nube opcional. Al vincularse a una cuenta de Google, la aplicación puede utilizar Gemini para un pulido de texto más avanzado o extraer datos de Gmail para crear un diccionario personalizado, asegurando que reconozca su vocabulario y nombres específicos.
Experiencia de usuario y personalización
La aplicación presenta una interfaz optimizada centrada en la utilidad, con una barra de navegación inferior que contiene:
– Grabar: La interfaz de dictado principal.
– Historial: Acceso a transcripciones anteriores.
– Diccionarios: Una herramienta para gestionar vocabulario personalizado.
– Configuración: Configuración para la integración de cuentas y la nube.
La función del diccionario está diseñada para ser de autoaprendizaje. Si la IA escribe mal un nombre o término técnico específico, un usuario puede corregirlo manualmente; La aplicación recordará esa corrección para sesiones futuras.
Contexto y disponibilidad del mercado
Si bien Google lleva mucho tiempo integrando la voz a texto en su ecosistema (como Gboard y Google Assistant), AI Edge Eloquent sirve como una herramienta independiente y especializada para los usuarios que priorizan la transcripción de alta calidad y la privacidad. En particular, la aplicación está actualmente disponible en Apple App Store sin tarifa de suscripción.
Aunque la aplicación es actualmente exclusiva para iOS, la descripción de la App Store menciona “integración perfecta de Android”, lo que sugiere que podría haber una versión de Android en el futuro.
Resumen: AI Edge Eloquent de Google ofrece una forma de alta calidad, gratuita y centrada en la privacidad de convertir el habla desordenada en texto limpio utilizando la IA en el dispositivo, lo que marca un importante paso adelante para hacer del dictado una alternativa viable a la escritura.
