додому Останні новини та статті Google посилює можливості ІІ у Flow та Flow Music

Google посилює можливості ІІ у Flow та Flow Music

Google знову робить ставку на творчість. Цього року конференція для розробників I/O принесла не просто дрібні покращення, а фундаментальні зміни. Компанія подвоює зусилля у розвитку Flow – ІІ-платформи для творчості, запущеної торік, та Flow Music – її «сестринського» сервісу для генерації звуку. Яка мета? Зробити процес створення контенту менш схожим на боротьбу із програмним забезпеченням та більш схожим на роботу з партнером.

Минулого року Google представляв Flow як хаб “для креативників, створений креативниками”. Обіцянка полягала в тому, щоб позбавити користувача необхідності використовувати півтора десятка різних додатків. Замість перемикання між інструментами для відео, анімації та монтажу, ви залишалися б в одному місці. Тепер компанія виконує цю обіцянку, впроваджуючи функції, які дійсно дозволяють ІІ вести вас за руку протягом усього процесу.

Flow знайшов розум (і пам’ять)

Еліас Роман, старший директор з управління продуктами Google, зазначив, що творчі професіонали ненавидять фрагментовані робочі процеси. Він назвав це вбивцею «творчого потоку». Перемикання між дорогими вузькоспеціалізованими програмами порушує концентрацію. Flow намагається вирішити цю проблему трьома великими ініціативами: покращеним контролем, крос-медійною сумісністю та зменшенням ізоляції інструментів.

Насамперед, Flow перестає бути просто полем для введення команд. Він перетворюється на діалогового агента. На основі моделі Gemini він пам’ятає історію вашого проекту. Він діє як інтелектуальна подушка для розмови. Застрягли на діалогах? ІІ може допомогти вам згенерувати сюжетні повороти. Йдеться не про генерацію разових кліпів, а про тривалу спільну творчість.

Потім з’являються Flow Tools. Ви можете створювати власні робочі процеси, використовуючи звичайну англійську мову. JavaScript не потрібний. Потрібен специфічний ресайзер відео чи незвичайний шейдер? Просто опишіть його. Створіть. Поділіться. Ця функція перетворює користувачів на міні-розробників без головного болю від програмування.

Істинне зрушення не у швидкості, а автономії. Ви говорите інструменту, що ви хочете, а не як це обчислювати.

Двигуном всього цього є Gemini Omni Flash. Google жартома називає його «Nano Banana», що, мабуть, не найкращий вибір з погляду піару. Але йдеться про серйозну технологію. Вона пропонує точне відео-до-відео редагування. Що ще важливіше, вона забезпечує консистентність персонажів. Якщо ваш аватар має шрам у першій сцені, він буде і в другій. Модель вже доступна передплатникам Google AI по всьому світу.

Роман продемонстрував можливості системи, що виглядало не так як презентація, що продає, скільки як фокусне мистецтво. Він створив сцену на Таймс-сквер у стилі 80-х з нуля. Він застосовував суворі обмеження – наприклад, вставляв мініатюрного пінчера в кожен кадр як великодні яйця. Він редагував відео поруч із допомогою текстових команд. Він рендерив персонажів у ASCII-графіці на льоту. Система не сповільнилася ні на мить.

І так, вони нарешті випустили мобільні програми. Flow знаходиться на стадії бета-тестування на Android (версія для iOS у розробці). Flow Music вже доступний на iOS (Android затримується). Тепер творчі люди можуть генерувати ідеї, стоячи у черзі за кавою.

Музика стає точною

Flow Music також одержав свої оновлення. Як правило, ІІ-генератори музики – це грубі інструменти. Ви вводите запит «веселий джаз» і сподіваєтесь на краще. Google хоче дати вам скальпель.

Тепер можна редагувати окремі частини пісні окремо. Бажаєте змінити текст, але зберегти біт? Легко. Хочете перекласти вокал іншою мовою, не змінюючи мелодію? Реально. Вам не потрібно щоразу генерувати весь трек заново. Це економить час та зберігає атмосферу незмінною.

Потім є функція каверів. Вона дозволяє взяти існуючий трек – зберігши мелодію та структуру – та замінити жанр. Перетворіть поп-гімн на lo-fi біти. Структура залишається незмінною, змінюється лише «смак».

Зрештою, технологія Omni Flash прийшла і в музичні відео. Ви отримуєте не лише аудіодоріжку. Ви можете керувати діалоговим способом створенням візуального супроводу. Скажіть ІІ, що хочете неонові вогні, дощовий провулок або захід сонця в стилі синтвейв. Він створить сцени, які відповідають настрою вашої пісні. Функція вже доступна передплатникам.

Що далі? У нас є ІІ, який пам’ятає нас, розмовляє з нами та редагує контент разом із нами. Це здається потужним інструментом. І, можливо, трохи лякаючим?

Exit mobile version