Google wprowadza „AI Edge Eloquent”: narzędzie do dyktowania dla systemu iOS, skupiające się na prywatności i pracy offline

12

Firma Google oficjalnie uruchomiła AI Edge Eloquent, nową aplikację na iOS opartą na sztucznej inteligencji, zaprojektowaną z myślą o przekształcaniu języka mówionego w czysty, profesjonalny tekst. W przeciwieństwie do tradycyjnych narzędzi do zamiany mowy na tekst, które często generują niechlujne transkrypcje, ta aplikacja wykorzystuje sztuczną inteligencję bezpośrednio na urządzeniu do edytowania mowy w czasie rzeczywistym.

Rozwiązanie problemu „słów wypełniających”

Głównym problemem standardowych technologii dyktowania zawsze była rozbieżność między sposobem, w jaki ludzie mówią, a sposobem, w jaki piszemy. Mowa naturalna jest często chaotyczna i pełna:
Wahania (na przykład „aha”, „mmm”);
Autokorekta (kiedy osoba zaczyna zdanie od nowa w procesie myślenia);
wypełniacze i powtarzające się pauzy.

Rozwiązanie AI Edge firmy Eloquent rozwiązuje ten problem, korzystając z lokalnych modeli Gemma firmy Google. Zamiast po prostu transkrybować każdy dźwięk wychwytywany przez mikrofon, sztuczna inteligencja działa jak automatyczny edytor. Rozpoznaje i usuwa resztki mowy, pozostawiając użytkownikowi czysty, spójny tekst, który wymaga minimalnej ręcznej edycji.

Prywatność i autonomia

Cechą wyróżniającą aplikację jest możliwość pracy całkowicie offline. Przetwarzając modele językowe bezpośrednio na iPhonie, zamiast wysyłać dane audio na zdalny serwer, Google zapewnia dwie ważne korzyści:
1. Prywatność: Poufne rozmowy pozostają na urządzeniu, co zmniejsza ryzyko wycieku danych.
2. Niezawodność: użytkownicy mogą dyktować notatki tam, gdzie nie ma dostępu do Internetu, na przykład podczas lotu lub w odległych obszarach.

Dla tych, którzy potrzebują zaawansowanych funkcji, aplikacja oferuje opcjonalne połączenie z chmurą. Połączenie z kontem Google umożliwia wykorzystanie Gemini do głębszego przetwarzania stylistycznego tekstu lub pobranie danych z Gmaila w celu stworzenia spersonalizowanego słownika, dzięki czemu sztuczna inteligencja rozpozna Twoje specyficzne słownictwo i nazwy.

Interfejs użytkownika i dostosowywanie

Aplikacja posiada lakoniczny, zorientowany na funkcjonalność interfejs. Dolny pasek nawigacyjny zawiera:
Nagranie: Główny interfejs dyktowania.
Historia: dostęp do poprzednich transkrypcji.
Słowniki: narzędzie do zarządzania Twoim osobistym słownikiem.
Ustawienia: konfiguracja chmury i integracja konta.

Funkcja słownika działa na zasadzie samouczenia się. Jeśli sztuczna inteligencja błędnie napisze konkretną nazwę lub termin techniczny, użytkownik może to poprawić ręcznie, a aplikacja zapamięta tę poprawkę na potrzeby przyszłych sesji.

Kontekst rynkowy i dostępność

Chociaż Google ma długą historię integrowania wprowadzania głosowego ze swoim ekosystemem (takim jak Gboard i Asystent Google), AI Edge firmy Eloquent to dedykowane, samodzielne narzędzie dla użytkowników ceniących wysoką jakość transkrypcji i prywatność. Warto dodać, że aplikacja jest obecnie dostępna w Apple App Store za darmo, bez abonamentu.

Chociaż aplikacja jest obecnie dostępna wyłącznie dla systemu iOS, w opisie App Store wspomniano o „bezproblemowej integracji z Androidem”, co sugeruje możliwą wersję dla tej platformy w przyszłości.

Konkluzja: Google AI Edge Eloquent oferuje wysokiej jakości, bezpłatny i zorientowany na prywatność sposób przekształcania chaotycznej mowy w czysty tekst przy użyciu lokalnej sztucznej inteligencji. To znaczący krok naprzód, dzięki któremu dyktowanie staje się pełnoprawną alternatywą dla pisania.