Google офіційно запустила AI Edge Eloquent — новий додаток для iOS на базі штучного інтелекту, призначений для перетворення мовлення у чистий та професійний текст. На відміну від традиційних інструментів перетворення мови на текст, які часто створюють «брудні» розшифровки, ця програма використовує ІІ безпосередньо на пристрої, щоб редагувати мову в режимі реального часу.
Вирішення проблеми «слів-паразитів»
Основною проблемою стандартних технологій диктування завжди був розрив між тим, як люди говорять, і тим, як ми пишемо. Природна мова часто буває сумбурною і сповнена:
– Заминками (наприклад, “е-е”, “ммм”);
– Самовиправлення (коли людина починає пропозицію заново в процесі думки);
– Словами-паразитами і повторюваними паузами.
AI Edge Eloquent вирішує цю проблему, використовуючи локальні моделі Gemma від Google. Замість того, щоб просто транскрибувати кожен звук, що уловлюється мікрофоном, ІІ виступає в ролі автоматичного редактора. Він розпізнає і видаляє мовне сміття, залишаючи користувачеві чистий, зв’язковий текст, який вимагає мінімальної ручної редагування.
Приватність та автономність
Відмінною рисою програми є його здатність працювати повністю офлайн. Обробляючи мовні моделі безпосередньо на iPhone, а не відправляючи аудіодані на віддалений сервер, Google забезпечує дві важливі переваги:
1. Приватність: Конфіденційні розмови залишаються на пристрої, що знижує ризик витоку даних.
2. Надійність: Користувачі можуть диктувати нотатки там, де немає доступу до інтернету, наприклад, під час польоту або у віддалених районах.
Для тих, кому потрібні розширені можливості, програма пропонує опціональне хмарне підключення. Прив’язка до облікового запису Google дозволяє використовувати Gemini для більш глибокої стилістичної обробки тексту або підтягувати дані з Gmail для створення персонального словника, завдяки чому ІІ дізнаватиметься про вашу специфічну лексику та імена.
Інтерфейс користувача та кастомізація
Програма відрізняється лаконічним інтерфейсом, орієнтованим на функціональність. Нижня панель навігації включає:
– Record (Запис): основний інтерфейс диктування.
– History (Історія): доступ до попередніх розшифровок.
– Dictionaries (Словники): інструмент для керування персональним словником.
– Settings (Налаштування): конфігурація хмари та інтеграція з обліковим записом.
Функція словника працює за принципом самонавчання. Якщо ІІ неправильно напише конкретне ім’я або технічний термін, користувач може виправити його вручну, і програма запам’ятає це виправлення для майбутніх сесій.
Контекст ринку та доступність
Хоча Google давно інтегрує функції голосового введення в свою екосистему (наприклад, Gboard і Google Assistant), AI Edge Eloquent є спеціалізованим самостійним інструментом для користувачів, яким важливі висока якість транскрибації і приватність. Примітно, що на даний момент програма доступна в Apple App Store безкоштовно, без підписки.
Незважаючи на те, що зараз програма ексклюзивна для iOS, в описі в App Store згадується “безшовна інтеграція з Android”, що натякає на можливий вихід версії для цієї платформи в майбутньому.
Результат: Google AI Edge Eloquent пропонує високоякісний, безкоштовний і орієнтований на приватність спосіб перетворення хаотичного мовлення в чистий текст за допомогою локального ІІ. Це значний крок уперед, що робить диктування повноцінною альтернативою набору тексту.
