Google официально запустила AI Edge Eloquent — новое приложение для iOS на базе искусственного интеллекта, предназначенное для превращения устной речи в чистый и профессиональный текст. В отличие от традиционных инструментов преобразования речи в текст, которые часто создают «грязные» расшифровки, это приложение использует ИИ непосредственно на устройстве, чтобы редактировать речь в режиме реального времени.
Решение проблемы «слов-паразитов»
Основной проблемой стандартных технологий диктовки всегда был разрыв между тем, как люди говорят, и тем, как мы пишем. Естественная речь часто бывает сумбурной и наполнена:
— Заминками (например, «э-э», «ммм»);
— Самоисправлениями (когда человек начинает предложение заново в процессе мысли);
— Словами-паразитами и повторяющимися паузами.
AI Edge Eloquent решает эту проблему, используя локальные модели Gemma от Google. Вместо того чтобы просто транскрибировать каждый звук, улавливаемый микрофоном, ИИ выступает в роли автоматического редактора. Он распознает и удаляет речевой мусор, оставляя пользователю чистый, связный текст, который требует минимальной ручной правки.
Приватность и автономность
Отличительной чертой приложения является его способность работать полностью офлайн. Обрабатывая языковые модели непосредственно на iPhone, а не отправляя аудиоданные на удаленный сервер, Google обеспечивает два важных преимущества:
1. Приватность: Конфиденциальные разговоры остаются на устройстве, что снижает риск утечки данных.
2. Надежность: Пользователи могут диктовать заметки там, где нет доступа к интернету, например, во время полета или в удаленных районах.
Для тех, кому нужны расширенные возможности, приложение предлагает опциональное облачное подключение. Привязка к аккаунту Google позволяет использовать Gemini для более глубокой стилистической обработки текста или подтягивать данные из Gmail для создания персонализированного словаря, благодаря чему ИИ будет узнавать вашу специфическую лексику и имена.
Пользовательский интерфейс и кастомизация
Приложение отличается лаконичным интерфейсом, ориентированным на функциональность. Нижняя панель навигации включает:
— Record (Запись): основной интерфейс диктовки.
— History (История): доступ к предыдущим расшифровкам.
— Dictionaries (Словари): инструмент для управления персональным словарем.
— Settings (Настройки): конфигурация облака и интеграция с аккаунтом.
Функция словаря работает по принципу самообучения. Если ИИ неправильно напишет конкретное имя или технический термин, пользователь может исправить его вручную, и приложение запомнит это исправление для будущих сессий.
Контекст рынка и доступность
Хотя Google давно интегрирует функции голосового ввода в свою экосистему (например, в Gboard и Google Assistant), AI Edge Eloquent является специализированным самостоятельным инструментом для пользователей, которым важны высокое качество транскрибации и приватность. Примечательно, что на данный момент приложение доступно в Apple App Store бесплатно, без подписки.
Несмотря на то, что сейчас приложение эксклюзивно для iOS, в описании в App Store упоминается «бесшовная интеграция с Android», что намекает на возможный выход версии для этой платформы в будущем.
Итог: Google AI Edge Eloquent предлагает высококачественный, бесплатный и ориентированный на приватность способ превращения хаотичной речи в чистый текст с помощью локального ИИ. Это значительный шаг вперед, делающий диктовку полноценной альтернативой набору текста.
