Google hat im Stillen eine neue KI-gesteuerte Diktieranwendung namens Google AI Edge Eloquent eingeführt. Die App wurde entwickelt, um mit spezialisierten Tools wie Wispr Flow und SuperWhisper zu konkurrieren, und zielt darauf ab, gesprochenes Wort in ausgefeilten, professionellen Text umzuwandeln, indem sie fortschrittliche künstliche Intelligenz auf dem Gerät nutzt.
So funktioniert es: Von der Rede zur ausgefeilten Prosa
Im Gegensatz zu herkömmlicher Diktiersoftware, die einfach jeden Ton transkribiert – einschließlich Stolpern und Zögern – verwendet Eloquent Gemma-basierte automatische Spracherkennungsmodelle (ASR), um Absichten zu interpretieren.
Zu den Kernfunktionen der App gehören:
– Automatische Verfeinerung: Es filtert auf intelligente Weise Füllwörter wie „ähm“ und „ah“ sowie Selbstkorrekturen in der Mitte des Satzes heraus.
– Kontextuelle Transformation: Sobald eine Transkription abgeschlossen ist, können Benutzer den Text sofort mit Voreinstellungen wie Formal, Kurz, Lang oder Schlüsselpunkte neu formatieren.
– Personalisiertes Vokabular: Die App kann bestimmte Namen, Fachjargon und Schlüsselwörter aus dem Gmail-Konto eines Benutzers importieren oder die manuelle Eingabe benutzerdefinierter Wörter ermöglichen, um die Genauigkeit zu verbessern.
Datenschutz und der „Offline-First“-Ansatz
Ein herausragendes Merkmal von Eloquent ist die Betonung der lokalen Verarbeitung. Während die App einen „Cloud-Modus“ bietet, der die leistungsstarken Gemini-Modelle von Google für eine verbesserte Textbereinigung nutzt, können Benutzer diesen vollständig deaktivieren.
Durch das Herunterladen der erforderlichen KI-Modelle direkt auf das Gerät kann die App offline funktionieren. Diese „Offline-First“-Architektur ist ein bedeutender Trend in der KI-Branche, da sie den wachsenden Bedenken der Benutzer hinsichtlich des Datenschutzes und der Sicherheit sensibler Informationen, die an Remote-Server gesendet werden, Rechnung trägt.
Funktionen und Benutzeroberfläche
Die App bietet ein umfassendes Dashboard zur Verwaltung transkribierter Inhalte, einschließlich:
– Live-Transkription: Benutzer können zusehen, wie der Text in Echtzeit erscheint.
– Sitzungsverlauf: Ein durchsuchbares Archiv aller früheren Transkriptionen.
– Leistungsmetriken: Daten zu Wörtern pro Minute (WPM) und zur Gesamtzahl der Wörter, damit Benutzer ihre Diktiereffizienz verfolgen können.
Verfügbarkeit und Plattformverwirrung
Derzeit steht die App auf iOS zum Download zur Verfügung, die Einführung scheint jedoch etwas inkonsistent zu sein. Während im App Store-Eintrag eine Android-Version erwähnt wird, ist die App auf dieser Plattform noch nicht verfügbar.
Die Beschreibung deutet jedoch darauf hin, dass wichtige Funktionen für Android-Benutzer in der Entwicklung sind, darunter:
– Systemweite Integration: Die Möglichkeit, Eloquent als Standardtastatur festzulegen.
– Floating Access: Eine schwebende Schaltfläche (ähnlich wie Wispr Flow), mit der Benutzer die Transkription aus jedem Textfeld im Betriebssystem auslösen können.
„Eloquent nutzt KI, um Ihre beabsichtigte Bedeutung zu erfassen … und gibt saubere, genaue Prosa aus“, heißt es in der offiziellen Beschreibung von Google.
Schlussfolgerung
Google AI Edge Eloquent stellt einen Wandel hin zu intelligenteren, privateren und „saubereren“ Transkriptionstools dar. Durch die Kombination von KI auf dem Gerät mit nahtloser Textverfeinerung positioniert sich Google für den Wettbewerb in der wachsenden Nische hochproduktiver, datenschutzbewusster KI-Dienstprogramme.
