Firma Google po cichu wprowadziła nową aplikację do dyktowania opartą na sztucznej inteligencji o nazwie Google AI Edge Eloquent. Zaprojektowana, aby konkurować z dedykowanymi narzędziami, takimi jak Wispr Flow i SuperWhisper, aplikacja ma na celu przekształcenie języka mówionego w dopracowany, profesjonalny tekst przy użyciu najnowocześniejszej technologii sztucznej inteligencji bezpośrednio na urządzeniu.
Jak to działa: od mowy do czystego tekstu
W przeciwieństwie do tradycyjnego oprogramowania do dyktowania, które po prostu transkrybuje każdy dźwięk – w tym jąkanie i wahanie – Eloquent wykorzystuje modele automatycznego rozpoznawania mowy (ASR) obsługiwane przez firmę Gemma do interpretacji znaczenia wypowiedzi.
Główne cechy aplikacji to:
– Automatyczna korekta: inteligentnie odfiltrowuje słowa wypełniające, takie jak „aha” i „um”, a także autokorekty w połowie zdania.
– Transformacja kontekstowa: po zakończeniu transkrypcji użytkownicy mogą natychmiast zmienić format tekstu, korzystając z gotowych ustawień, takich jak Oficjalny, Krótki, Długi lub Najciekawsze.
– Spersonalizowany słownik: aplikacja może importować określone nazwy, żargon i słowa kluczowe z konta Gmail użytkownika lub umożliwiać ręczne wprowadzanie niestandardowych słów w celu zwiększenia dokładności.
Prywatność i podejście „najpierw offline”.
Tym, co wyróżnia firmę Eloquent, jest nacisk na przetwarzanie lokalne. Chociaż aplikacja oferuje „tryb chmury”, który wykorzystuje zaawansowane modele Google Gemini do głębszego czyszczenia tekstu, użytkownicy mogą całkowicie wyłączyć tę funkcję.
Pobierając wymagane modele AI bezpośrednio na urządzenie, aplikacja może działać bez połączenia z Internetem. Ta architektura „najpierw offline” jest znaczącym trendem w branży sztucznej inteligencji, ponieważ odpowiada na rosnące obawy użytkowników dotyczące prywatności danych i bezpieczeństwa wrażliwych informacji przesyłanych do zdalnych serwerów.
Funkcje i interfejs użytkownika
Aplikacja zapewnia kompleksowy panel sterowania transkrypcją treści, w tym:
– Transkrypcja w czasie rzeczywistym: użytkownicy mogą oglądać tekst pojawiający się w czasie rzeczywistym.
– Historia sesji: Archiwum wszystkich poprzednich transkrypcji z możliwością przeszukiwania.
– Wskaźniki wydajności: Dane dotyczące słów na minutę (WPM) i całkowitej liczby słów pomagają użytkownikom śledzić wydajność dyktowania.
Dostępność i zamieszanie na platformie
Aplikacja jest obecnie dostępna do pobrania na iOS, chociaż proces wdrażania wydaje się nieco niespójny. Pomimo tego, że w opisie App Store mowa jest o wersji na Androida, aplikacja nie jest jeszcze dostępna na tę platformę.
Z opisu wynika jednak, że opracowywane są ważne funkcje dla użytkowników Androida, w tym:
– Integracja systemu: Możliwość ustawienia Eloquent jako klawiatury domyślnej.
– Dostęp pływający: Pływający przycisk (podobny do Wispr Flow), który umożliwia rozpoczęcie transkrypcji w dowolnym polu tekstowym w systemie operacyjnym.
„Eloquent wykorzystuje sztuczną inteligencję, aby uchwycić Twoje intencje… dostarczając czysty, dokładny tekst” – czytamy w oficjalnym opisie Google.
Wniosek
Google AI Edge Eloquent oznacza zwrot w kierunku inteligentniejszych, bardziej prywatnych i czystszych narzędzi do transkrypcji. Łącząc sztuczną inteligencję na urządzeniu z płynnym ulepszaniem tekstu, Google pozycjonuje się jako poważny gracz w rosnącej niszy wydajnych narzędzi sztucznej inteligencji zorientowanych na prywatność.
