Google представляет «AI Edge Eloquent»: инструмент для диктовки на iOS с упором на приватность и работу офлайн

15

Google официально запустила AI Edge Eloquent — новое приложение для iOS на базе искусственного интеллекта, предназначенное для превращения устной речи в чистый и профессиональный текст. В отличие от традиционных инструментов преобразования речи в текст, которые часто создают «грязные» расшифровки, это приложение использует ИИ непосредственно на устройстве, чтобы редактировать речь в режиме реального времени.

Решение проблемы «слов-паразитов»

Основной проблемой стандартных технологий диктовки всегда был разрыв между тем, как люди говорят, и тем, как мы пишем. Естественная речь часто бывает сумбурной и наполнена:
Заминками (например, «э-э», «ммм»);
Самоисправлениями (когда человек начинает предложение заново в процессе мысли);
Словами-паразитами и повторяющимися паузами.

AI Edge Eloquent решает эту проблему, используя локальные модели Gemma от Google. Вместо того чтобы просто транскрибировать каждый звук, улавливаемый микрофоном, ИИ выступает в роли автоматического редактора. Он распознает и удаляет речевой мусор, оставляя пользователю чистый, связный текст, который требует минимальной ручной правки.

Приватность и автономность

Отличительной чертой приложения является его способность работать полностью офлайн. Обрабатывая языковые модели непосредственно на iPhone, а не отправляя аудиоданные на удаленный сервер, Google обеспечивает два важных преимущества:
1. Приватность: Конфиденциальные разговоры остаются на устройстве, что снижает риск утечки данных.
2. Надежность: Пользователи могут диктовать заметки там, где нет доступа к интернету, например, во время полета или в удаленных районах.

Для тех, кому нужны расширенные возможности, приложение предлагает опциональное облачное подключение. Привязка к аккаунту Google позволяет использовать Gemini для более глубокой стилистической обработки текста или подтягивать данные из Gmail для создания персонализированного словаря, благодаря чему ИИ будет узнавать вашу специфическую лексику и имена.

Пользовательский интерфейс и кастомизация

Приложение отличается лаконичным интерфейсом, ориентированным на функциональность. Нижняя панель навигации включает:
Record (Запись): основной интерфейс диктовки.
History (История): доступ к предыдущим расшифровкам.
Dictionaries (Словари): инструмент для управления персональным словарем.
Settings (Настройки): конфигурация облака и интеграция с аккаунтом.

Функция словаря работает по принципу самообучения. Если ИИ неправильно напишет конкретное имя или технический термин, пользователь может исправить его вручную, и приложение запомнит это исправление для будущих сессий.

Контекст рынка и доступность

Хотя Google давно интегрирует функции голосового ввода в свою экосистему (например, в Gboard и Google Assistant), AI Edge Eloquent является специализированным самостоятельным инструментом для пользователей, которым важны высокое качество транскрибации и приватность. Примечательно, что на данный момент приложение доступно в Apple App Store бесплатно, без подписки.

Несмотря на то, что сейчас приложение эксклюзивно для iOS, в описании в App Store упоминается «бесшовная интеграция с Android», что намекает на возможный выход версии для этой платформы в будущем.

Итог: Google AI Edge Eloquent предлагает высококачественный, бесплатный и ориентированный на приватность способ превращения хаотичной речи в чистый текст с помощью локального ИИ. Это значительный шаг вперед, делающий диктовку полноценной альтернативой набору текста.