Google spouští „Eloquent“: nový nástroj pro diktování využívající umělou inteligenci se zaměřením na soukromí offline

2

Google v tichosti představil novou aplikaci pro diktování s umělou inteligencí s názvem Google AI Edge Eloquent. Tato aplikace je navržena tak, aby konkurovala specializovaným nástrojům, jako je Wispr Flow a SuperWhisper, a jejím cílem je přeměnit mluvený jazyk na uhlazený profesionální text pomocí špičkové technologie AI přímo v zařízení.

Jak to funguje: od řeči k čistému textu

Na rozdíl od tradičního diktovacího softwaru, který jednoduše přepisuje každý zvuk – včetně koktání a zaváhání – Eloquent používá modely automatického rozpoznávání řeči (ASR) od Gemmy k interpretaci významu toho, co je řečeno.

Mezi hlavní funkce aplikace patří:
Automatická oprava: Inteligentně filtruje výplňová slova jako „uh“ a „ehm“ a také samoopravy uprostřed vět.
Kontextová transformace: Po dokončení přepisu mohou uživatelé okamžitě přeformátovat text pomocí předem připravených předvoleb, jako jsou Oficiální, Krátké, Dlouhé nebo Zvýrazněné.
Personalizovaný slovník: Aplikace může importovat konkrétní jména, žargon a klíčová slova z uživatelského účtu Gmail nebo povolit ruční zadávání vlastních slov pro zvýšení přesnosti.

Soukromí a přístup „offline first“.

Co odlišuje Eloquent od ostatních, je důraz na místní zpracování. Zatímco aplikace nabízí „Cloud Mode“, který využívá výkonné modely Gemini od Googlu pro hlubší čištění textu, uživatelé mohou tuto funkci zcela deaktivovat.

Stažením požadovaných modelů AI přímo do zařízení může aplikace fungovat bez připojení k internetu. Tato „offline first“ architektura je významným trendem v odvětví umělé inteligence, protože řeší rostoucí obavy uživatelů o soukromí dat a zabezpečení citlivých informací přenášených na vzdálené servery.

Funkce a uživatelské rozhraní

Aplikace poskytuje komplexní ovládací panel pro přepsaný obsah, včetně:
Přepis v reálném čase: Uživatelé mohou sledovat, jak se text objevuje v reálném čase.
Historie relace: Prohledávatelný archiv všech předchozích přepisů.
Metriky výkonu: Údaje o slovech za minutu (WPM) a celkovém počtu slov pomáhají uživatelům sledovat výkon při diktování.

Dostupnost a zmatek platforem

Aplikace je aktuálně k dispozici ke stažení na iOS, i když se proces zavádění zdá trochu nekonzistentní. Navzdory tomu, že popis App Store zmiňuje verzi pro Android, aplikace zatím není na této platformě dostupná.

Popis však naznačuje, že pro uživatele Androidu jsou vyvíjeny důležité funkce, včetně:
Systémová integrace: Možnost nastavit Eloquent jako výchozí klávesnici.
Plovoucí přístup: Plovoucí tlačítko (podobné Wispr Flow), které vám umožňuje spustit přepis v libovolném textovém poli v operačním systému.

„Eloquent používá AI k zachycení vašeho záměru… dodává čistý a přesný text,“ stojí v oficiálním popisu Google.


Závěr
Google AI Edge Eloquent znamená posun směrem k chytřejším, soukromějším a čistším nástrojům pro přepis. Kombinací umělé inteligence na zařízení s bezproblémovým vylepšováním textu se Google staví jako vážný hráč v rostoucím výklenku vysoce výkonných nástrojů umělé inteligence zaměřených na soukromí.