Google posiluje schopnosti umělé inteligence ve Flow a Flow Music

11

Google se opět zaměřuje na kreativitu. Letošní vývojářská konference I/O přinesla více než jen drobná vylepšení, ale zásadní změny. Společnost zdvojnásobuje Flow, platformu pro kreativitu AI spuštěnou v loňském roce, a Flow Music, sesterskou službu generování zvuku. co je cílem? Udělejte z procesu vytváření obsahu méně zápolení se softwarem a více jako práci s partnerem.

Minulý rok Google představil Flow jako centrum „pro kreativy, podle kreativ“. Slibem bylo ušetřit uživatele od nutnosti používat tucet různých aplikací. Místo přepínání mezi nástroji pro video, animaci a úpravy byste zůstali na jednom místě. Nyní společnost tento slib plní a představuje funkce, které skutečně umožňují umělé inteligenci, aby vás celým procesem vedla za ruku.

Flow získal inteligenci (a paměť)

Elias Roman, vrchní ředitel produktového managementu společnosti Google, poznamenal, že kreativní profesionálové nenávidí roztříštěné pracovní postupy. Nazval to zabijákem „creative flow“. Přepínání mezi drahými, vysoce specializovanými aplikacemi narušuje koncentraci. Flow se snaží tento problém vyřešit třemi hlavními iniciativami: vylepšeným ovládáním, kompatibilitou mezi médii a sníženou izolací nástrojů.

Za prvé, Flow už není jen pole pro zadávání příkazů. Promění se v konverzačního agenta. Na základě modelu Gemini si pamatuje historii vašeho projektu. Působí jako intelektuální konverzační polštář. Zasekli jste se v dialozích? AI vám může pomoci vytvořit zápletky. Nemluvíme o generování jednorázových klipů, ale o dlouhodobé společné kreativitě.

Poté se zobrazí Flow Tools. Pomocí jednoduché angličtiny můžete vytvářet vlastní pracovní postupy. Není vyžadován JavaScript. Potřebujete konkrétní video resizer nebo neobvyklý shader? Stačí to popsat. Vytvořit. Podíl. Tato funkce promění uživatele v minivývojáře bez starostí s programováním.

Skutečný posun nespočívá v rychlosti, ale v autonomii. Říkáte nástroji co chcete, ne jak to má vypočítat.

Motorem za vším je Gemini Omni Flash. Google tomu vtipně říká „Nano Banana“, což nemusí být z hlediska PR nejlepší volba. Ale mluvíme o seriózní technologii. Nabízí přesnou střih videa na video. A co je důležitější, dodává postavám konzistenci. Pokud má váš avatar v první scéně jizvu, objeví se ve druhé. Model je již dostupný předplatitelům Google AI po celém světě.

Román demonstroval schopnosti systému, který vypadal méně jako prodejní prezentace a více jako umění magie. Od nuly vytvořil scénu na Times Square na téma 80. let. Prosadil přísná omezení, jako je vkládání miniaturního pinče do každého rámečku jako velikonoční vajíčko. Videa upravoval vedle sebe pomocí textových příkazů. To vykreslovalo znaky v ASCII grafice za běhu. Systém se nezpomalil ani na vteřinu.

A ano, konečně vydali mobilní aplikace. Flow je v beta testování na Androidu (verze pro iOS je ve vývoji). Flow Music je již k dispozici pro iOS (Android se očekává se zpožděním). Nyní mohou kreativní lidé vytvářet nápady, zatímco stojí ve frontě na kávu.

Hudba se stává přesnou

Své aktualizace se dočkala i Flow Music. Hudební generátory AI jsou obvykle tupé nástroje. Hledáte „zábavný jazz“ a doufáte v to nejlepší. Google vám chce dát skalpel.

Nyní můžete jednotlivě upravovat jednotlivé části skladby. Chcete změnit text, ale zachovat rytmus? Snadno. Chcete přeložit vokály do jiného jazyka, aniž byste změnili melodii? Opravdu. Nemusíte pokaždé regenerovat celou trať. To šetří čas a udržuje konstantní atmosféru.

Pak je tu funkce krytů. Umožňuje vám převzít existující skladbu – zachovat melodii a strukturu – a nahradit žánr. Proměňte popovou hymnu na lo-fi beaty. Struktura zůstává stejná, mění se pouze „chuť“.

Technologie Omni Flash konečně přišla i na hudební videa. Nezískáte jen zvukovou stopu. Interaktivně můžete ovládat tvorbu vizuálního doprovodu. Řekněte AI, že chcete neonová světla, deštivou uličku nebo synthwave západ slunce. Vytvoří scény, které odpovídají náladě vaší písně. Funkce je již k dispozici předplatitelům.

co bude dál? Máme AI, která si nás pamatuje, mluví s námi a upravuje s námi obsah. Vypadá to jako mocný nástroj. A možná trochu děsivé?