Google ha introducido discretamente una nueva aplicación de dictado basada en IA llamada Google AI Edge Eloquent. Diseñada para competir con herramientas especializadas como Wispr Flow y SuperWhisper, la aplicación tiene como objetivo transformar la palabra hablada en texto pulido y profesional aprovechando la inteligencia artificial avanzada del dispositivo.
Cómo funciona: del discurso a la prosa pulida
A diferencia del software de dictado tradicional que simplemente transcribe cada sonido, incluidos los tropiezos y las vacilaciones, Eloquent utiliza modelos de reconocimiento automático de voz (ASR) basado en Gemma para interpretar la intención.
La funcionalidad principal de la aplicación incluye:
– Refinamiento automático: Filtra inteligentemente palabras de relleno como “um” y “ah”, así como autocorrecciones a mitad de oración.
– Transformación contextual: Una vez que se completa una transcripción, los usuarios pueden reformatear instantáneamente el texto usando ajustes preestablecidos como Formal, Corto, Largo o Puntos clave.
– Vocabulario personalizado: La aplicación puede importar nombres, jerga y palabras clave específicos desde la cuenta de Gmail de un usuario o permitir la entrada manual de palabras personalizadas para mejorar la precisión.
Privacidad y el enfoque “primero sin conexión”
Una característica destacada de Eloquent es su énfasis en el procesamiento local. Si bien la aplicación ofrece un “Modo Nube” que utiliza los potentes modelos Gemini de Google para una limpieza mejorada del texto, los usuarios pueden optar por desactivarlo por completo.
Al descargar los modelos de IA necesarios directamente al dispositivo, la aplicación puede funcionar sin conexión. Esta arquitectura “primero fuera de línea” es una tendencia importante en la industria de la IA, ya que aborda las crecientes preocupaciones de los usuarios con respecto a la privacidad de los datos y la seguridad de la información confidencial que se envía a servidores remotos.
Funciones e interfaz de usuario
La aplicación proporciona un panel completo para administrar contenido transcrito, que incluye:
– Transcripción en vivo: Los usuarios pueden ver el texto aparecer en tiempo real.
– Historial de sesiones: Un archivo con capacidad de búsqueda de todas las transcripciones anteriores.
– Métricas de rendimiento: Datos sobre palabras por minuto (WPM) y recuento total de palabras para ayudar a los usuarios a realizar un seguimiento de la eficiencia de su dictado.
Disponibilidad y confusión de plataformas
Actualmente, la aplicación está disponible para descargar en iOS, aunque la implementación parece algo inconsistente. Si bien la lista de la App Store menciona una versión de Android, la aplicación aún no está disponible en esa plataforma.
Sin embargo, la descripción sugiere que se están desarrollando funciones importantes para los usuarios de Android, que incluyen:
– Integración de todo el sistema: La capacidad de configurar Eloquent como teclado predeterminado.
– Acceso flotante: Un botón flotante (similar a Wispr Flow) que permite a los usuarios activar la transcripción desde cualquier campo de texto en todo el sistema operativo.
“Eloquent utiliza IA para capturar el significado deseado… generando una prosa limpia y precisa”, según la descripción oficial de Google.
Conclusión
Google AI Edge Eloquent representa un cambio hacia herramientas de transcripción más inteligentes, privadas y “limpias”. Al combinar la IA en el dispositivo con un refinamiento fluido del texto, Google se está posicionando para competir en el creciente nicho de las utilidades de IA de alta productividad y conscientes de la privacidad.
