Google запускает «Eloquent»: новый инструмент диктовки на базе ИИ с упором на конфиденциальность в офлайн-режиме

18

Google незаметно представила новое приложение для диктовки на базе искусственного интеллекта под названием Google AI Edge Eloquent. Разработанное для конкуренции со специализированными инструментами, такими как Wispr Flow и SuperWhisper, приложение стремится превращать устную речь в отточенный, профессиональный текст, используя передовые технологии ИИ непосредственно на устройстве.

Как это работает: от речи к чистому тексту

В отличие от традиционного программного обеспечения для диктовки, которое просто транскрибирует каждый звук — включая запинки и колебания, — Eloquent использует модели автоматического распознавания речи (ASR) на базе Gemma, чтобы интерпретировать смысл сказанного.

Основные функции приложения включают:
Автоматическая правка: Оно интеллектуально отфильтровывает слова-паразиты, такие как «э-э» и «м-м», а также самоисправления в середине предложения.
Контекстная трансформация: После завершения транскрипции пользователи могут мгновенно переформатировать текст, используя готовые пресеты, такие как Официальный, Краткий, Длинный или Основные тезисы.
Персонализированный словарь: Приложение может импортировать специфические имена, жаргон и ключевые слова из аккаунта Gmail пользователя или позволять вручную вводить пользовательские слова для повышения точности.

Конфиденциальность и подход «сначала офлайн»

Отличительной чертой Eloquent является акцент на локальной обработке данных. Хотя приложение предлагает «Облачный режим», использующий мощные модели Gemini от Google для более глубокой очистки текста, пользователи могут полностью отключить эту функцию.

Благодаря загрузке необходимых ИИ-моделей непосредственно на устройство, приложение может работать без подключения к интернету. Такая архитектура «сначала офлайн» является значимым трендом в индустрии ИИ, так как она решает растущие опасения пользователей по поводу конфиденциальности данных и безопасности конфиденциальной информации, передаваемой на удаленные серверы.

Функции и пользовательский интерфейс

Приложение предоставляет комплексную панель управления транскрибированным контентом, включая:
Транскрипция в реальном времени: Пользователи могут наблюдать за появлением текста в режиме реального времени.
История сессий: Поисковый архив всех предыдущих транскрипций.
Показатели эффективности: Данные о количестве слов в минуту (WPM) и общем количестве слов, помогающие пользователям отслеживать эффективность диктовки.

Доступность и путаница с платформами

На данный момент приложение доступно для загрузки на iOS, хотя процесс развертывания кажется несколько непоследовательным. Несмотря на то, что в описании App Store упоминается версия для Android, на этой платформе приложение пока не представлено.

Тем не менее, описание предполагает, что для пользователей Android разрабатываются важные функции, включая:
Системная интеграция: Возможность установить Eloquent в качестве клавиатуры по умолчанию.
Плавающий доступ: Плавающая кнопка (по аналогии с Wispr Flow), которая позволяет запускать транскрипцию в любом текстовом поле в рамках операционной системы.

«Eloquent использует ИИ для фиксации вашего намерения… выдавая чистый, точный текст», — гласит официальное описание Google.


Заключение
Google AI Edge Eloquent знаменует собой переход к более интеллектуальным, приватным и «чистым» инструментам транскрипции. Сочетая ИИ на устройстве с бесшовной доработкой текста, Google позиционирует себя как серьезного игрока в растущей нише высокопроизводительных и ориентированных на приватность ИИ-утилит.