Google scommette ancora una volta molto sulla creatività. La conferenza degli sviluppatori I/O di quest’anno non ha apportato solo modifiche. Ha portato revisioni. L’azienda sta raddoppiando gli investimenti su Flow, lo studio creativo di intelligenza artificiale lanciato lo scorso anno, e su Flow Music, la sua piattaforma gemella per la generazione del suono. L’obiettivo? Fare in modo che la creazione di cose sembri meno come combattere un software e più come avere un partner.
L’anno scorso, Google ha presentato Flow come un hub “per creativi, da creativi”. Prometteva di eliminare la necessità di una mezza dozzina di app diverse. Invece di rimbalzare tra gli strumenti per video, animazione e editing, rimarrai in un unico posto. Ora stanno mantenendo questa promessa con funzionalità che consentono effettivamente all’intelligenza artificiale di tenerti per mano durante il processo.
Il flusso acquisisce un cervello (e una memoria)
Elias Roman, direttore senior della gestione dei prodotti di Google, ha affermato che i creatori odiano i flussi di lavoro frammentati. La chiamava la fine dello “stato di flusso”. Il passaggio da una costosa app monouso all’altra interrompe la tua concentrazione. Flow sta cercando di risolvere questo problema con tre grandi spinte: migliore controllo, compatibilità crossmediale e meno silos.
Il primo? Il flusso smette di essere solo una finestra di dialogo. Sta diventando un agente conversazionale. Alimentato da Gemini, ricorda la cronologia del tuo progetto. Funziona come una cassa di risonanza. Bloccato nel dialogo? L’intelligenza artificiale può scambiare idee con te sui punti della trama. Si tratta meno di generare clip una tantum e più di collaborazione di lunga durata.
Poi ci sono gli Strumenti di flusso. Puoi codificare flussi di lavoro personalizzati utilizzando un inglese semplice. Non è richiesto JavaScript. Desideri un ridimensionatore video specifico o uno strano effetto shader? Basta descriverlo. Costruiscilo. Condividilo. La funzionalità trasforma gli utenti in mini-sviluppatori senza il mal di testa dello sviluppatore.
Il vero cambiamento non è la velocità. È l’agenzia. Dici allo strumento cosa vuoi, non come calcolarlo.
Il motore che lo alimenta è Gemini Omni Flash. Google l’ha chiamata scherzosamente “Nano Banana”, che probabilmente non è la loro migliore scelta di pubbliche relazioni. Ma è una tecnologia seria. Porta in tavola un editing video-video preciso. Ancora più importante, gestisce la coerenza dei personaggi. Se il tuo avatar ha una cicatrice nella scena uno, avrà quella cicatrice nella scena due. Il modello è ora disponibile per gli abbonati globali di Google AI.
Roman ha tenuto una demo che sembrava meno una presentazione di vendita e più un trucco magico. Ha costruito da zero una scena di Times Square degli anni ’80. Ha applicato vincoli rigidi, come incorporare un pinscher in miniatura in ogni scatto come un uovo di Pasqua. Ha montato video affiancati con comandi di testo. Ha reso al volo i caratteri ASCII art. Il sistema non ha battuto ciglio.
Oh, e hanno creato app mobili. Finalmente. Flow è in versione beta su Android (iOS è in arrivo). Flow Music è disponibile su iOS (Android è in attesa). I creatori ora possono fare brainstorming mentre sono in fila per un caffè.
La musica riceve un trattamento preciso
Anche Flow Music ha ricevuto un po’ di amore. Di solito, i generatori di musica AI sono strumenti contundenti. Tu suggerisci “happy jazz” e preghi per il meglio. Google vuole invece darti un bisturi.
Ora puoi modificare parti di una canzone individualmente. Vuoi cambiare il testo ma mantenere il ritmo? Facile. Vuoi tradurre la voce in un’altra lingua senza alterare la melodia? Fattibile. Non stai rigenerando l’intera traccia da zero ogni volta. Ciò fa risparmiare tempo e mantiene l’atmosfera coerente.
Poi c’è la funzione di copertina. Ti consente di prendere una traccia esistente, mantenendo la melodia e la struttura, e scambiare il genere. Trasforma un inno pop in ritmi lo-fi. La struttura resta, il sapore cambia.
Infine, Omni Flash arriva ai video musicali. Non ottieni solo una traccia audio. Puoi indirizzare in modo conversazionale un compagno visivo per accompagnarlo. Dì all’IA che vuoi luci al neon, un vicolo piovoso o un tramonto con onde sintetiche. Costruisce le scene per adattarle allo stato d’animo della tua canzone. Disponibile ora per gli abbonati.
E adesso? Abbiamo un’intelligenza artificiale che ci ricorda, ci parla e modifica insieme a noi. Sembra potente. Inoltre, forse un po’ snervante?
