Google непомітно представила новий додаток для диктування на базі штучного інтелекту під назвою Google AI Edge Eloquent. Розроблений для конкуренції зі спеціалізованими інструментами, такими як Wispr Flow та SuperWhisper, додаток прагне перетворювати усне мовлення у відточений, професійний текст, використовуючи передові технології ІІ безпосередньо на пристрої.
Як це працює: від мови до чистого тексту
На відміну від традиційного програмного забезпечення для диктування, яке просто транскрибує кожен звук — включаючи запинки та коливання, — Eloquent використовує моделі автоматичного розпізнавання мовлення (ASR) на базі Gemma, щоб інтерпретувати зміст сказаного.
Основні функції програми включають:
– Автоматична правка: Воно інтелектуально відфільтровує слова-паразити, такі як «е-е» та «м-м», а також самовиправлення в середині речення.
– Контекстна трансформація: Після завершення транскрипції користувачі можуть миттєво переформатувати текст, використовуючи готові пресети, такі як Офіційний, Короткий, Довгий або Основні тези.
– Персоналізований словник: Програма може імпортувати специфічні імена, жаргон та ключові слова з облікового запису Gmail користувача або дозволяти вручну вводити слова користувача для підвищення точності.
Конфіденційність та підхід «спочатку офлайн»
Відмінною рисою Eloquent є акцент на локальній обробці даних. Хоча програма пропонує «Хмарний режим», який використовує потужні моделі Gemini від Google для глибшого очищення тексту, користувачі можуть повністю вимкнути цю функцію.
Завдяки завантаженню необхідних ІІ-моделей безпосередньо на пристрій, програма може працювати без підключення до інтернету. Така архітектура «спочатку офлайн» є значним трендом в індустрії ІІ, оскільки вона вирішує побоювання користувачів з приводу конфіденційності даних і безпеки конфіденційної інформації, що передається на віддалені сервери.
Функції та інтерфейс користувача
Додаток надає комплексну панель керування транскрибованим контентом, включаючи:
– Транскрипція у реальному часі: Користувачі можуть спостерігати за появою тексту в режимі реального часу.
– Історія сесій: Пошуковий архів усіх попередніх транскрипцій.
– Показники ефективності: Дані про кількість слів за хвилину (WPM) та загальну кількість слів, які допомагають користувачам відстежувати ефективність диктування.
Доступність і плутанина з платформами
На даний момент програма доступна для завантаження на iOS, хоча процес розгортання здається дещо непослідовним. Незважаючи на те, що в описі App Store згадується версія для Android, на цій платформі програма поки не представлена.
Проте опис передбачає, що для користувачів Android розробляються важливі функції, включаючи:
– Системна інтеграція: Можливість встановити Eloquent як клавіатуру за замовчуванням.
– Плаваючій доступ: Плаваюча кнопка (за аналогією з Wispr Flow), яка дозволяє запускати транскрипцію в будь-якому текстовому полі в рамках операційної системи.
“Eloquent використовує ІІ для фіксації вашого наміру … видаючи чистий, точний текст”, – говорить офіційний опис Google.
Висновок
Google AI Edge Eloquent знаменує собою перехід до більш інтелектуальних, приватних та «чистих» інструментів транскрипції. Поєднуючи ІІ на пристрої з безшовним доопрацюванням тексту, Google позиціонує себе як серйозного гравця в зростаючій ніші високопродуктивних і орієнтованих на приватність ІІ-утиліт.




































































