Firma Google oficjalnie uruchomiła AI Edge Eloquent, nową aplikację na iOS opartą na sztucznej inteligencji, zaprojektowaną z myślą o przekształcaniu języka mówionego w czysty, profesjonalny tekst. W przeciwieństwie do tradycyjnych narzędzi do zamiany mowy na tekst, które często generują niechlujne transkrypcje, ta aplikacja wykorzystuje sztuczną inteligencję bezpośrednio na urządzeniu do edytowania mowy w czasie rzeczywistym.
Rozwiązanie problemu „słów wypełniających”
Głównym problemem standardowych technologii dyktowania zawsze była rozbieżność między sposobem, w jaki ludzie mówią, a sposobem, w jaki piszemy. Mowa naturalna jest często chaotyczna i pełna:
– Wahania (na przykład „aha”, „mmm”);
– Autokorekta (kiedy osoba zaczyna zdanie od nowa w procesie myślenia);
– wypełniacze i powtarzające się pauzy.
Rozwiązanie AI Edge firmy Eloquent rozwiązuje ten problem, korzystając z lokalnych modeli Gemma firmy Google. Zamiast po prostu transkrybować każdy dźwięk wychwytywany przez mikrofon, sztuczna inteligencja działa jak automatyczny edytor. Rozpoznaje i usuwa resztki mowy, pozostawiając użytkownikowi czysty, spójny tekst, który wymaga minimalnej ręcznej edycji.
Prywatność i autonomia
Cechą wyróżniającą aplikację jest możliwość pracy całkowicie offline. Przetwarzając modele językowe bezpośrednio na iPhonie, zamiast wysyłać dane audio na zdalny serwer, Google zapewnia dwie ważne korzyści:
1. Prywatność: Poufne rozmowy pozostają na urządzeniu, co zmniejsza ryzyko wycieku danych.
2. Niezawodność: użytkownicy mogą dyktować notatki tam, gdzie nie ma dostępu do Internetu, na przykład podczas lotu lub w odległych obszarach.
Dla tych, którzy potrzebują zaawansowanych funkcji, aplikacja oferuje opcjonalne połączenie z chmurą. Połączenie z kontem Google umożliwia wykorzystanie Gemini do głębszego przetwarzania stylistycznego tekstu lub pobranie danych z Gmaila w celu stworzenia spersonalizowanego słownika, dzięki czemu sztuczna inteligencja rozpozna Twoje specyficzne słownictwo i nazwy.
Interfejs użytkownika i dostosowywanie
Aplikacja posiada lakoniczny, zorientowany na funkcjonalność interfejs. Dolny pasek nawigacyjny zawiera:
– Nagranie: Główny interfejs dyktowania.
– Historia: dostęp do poprzednich transkrypcji.
– Słowniki: narzędzie do zarządzania Twoim osobistym słownikiem.
– Ustawienia: konfiguracja chmury i integracja konta.
Funkcja słownika działa na zasadzie samouczenia się. Jeśli sztuczna inteligencja błędnie napisze konkretną nazwę lub termin techniczny, użytkownik może to poprawić ręcznie, a aplikacja zapamięta tę poprawkę na potrzeby przyszłych sesji.
Kontekst rynkowy i dostępność
Chociaż Google ma długą historię integrowania wprowadzania głosowego ze swoim ekosystemem (takim jak Gboard i Asystent Google), AI Edge firmy Eloquent to dedykowane, samodzielne narzędzie dla użytkowników ceniących wysoką jakość transkrypcji i prywatność. Warto dodać, że aplikacja jest obecnie dostępna w Apple App Store za darmo, bez abonamentu.
Chociaż aplikacja jest obecnie dostępna wyłącznie dla systemu iOS, w opisie App Store wspomniano o „bezproblemowej integracji z Androidem”, co sugeruje możliwą wersję dla tej platformy w przyszłości.
Konkluzja: Google AI Edge Eloquent oferuje wysokiej jakości, bezpłatny i zorientowany na prywatność sposób przekształcania chaotycznej mowy w czysty tekst przy użyciu lokalnej sztucznej inteligencji. To znaczący krok naprzód, dzięki któremu dyktowanie staje się pełnoprawną alternatywą dla pisania.






























