Google mise à nouveau gros sur la créativité. La conférence des développeurs d’E/S de cette année n’a pas seulement apporté des modifications. Cela a apporté des révisions. La société double la mise sur Flow, le studio de création d’IA lancé l’année dernière, et sur Flow Music, sa plateforme sœur pour la génération sonore. Le but ? Pour que la création de choses ressemble moins à un combat contre un logiciel qu’à un partenariat.
L’année dernière, Google a présenté Flow comme un hub « pour les créatifs, par les créatifs ». Il promettait de supprimer le besoin d’une demi-douzaine d’applications différentes. Au lieu de basculer entre les outils de vidéo, d’animation et de montage, vous resteriez au même endroit. Aujourd’hui, ils tiennent cette promesse avec des fonctionnalités qui permettent à l’IA de vous tenir la main tout au long du processus.
Flow obtient un cerveau (et une mémoire)
Elias Roman, directeur principal de la gestion des produits chez Google, a déclaré que les créateurs détestent les flux de travail fragmentés. Il a appelé cela la fin de « l’état de flux ». Passer d’une application coûteuse à un seul objectif à un autre vous empêche de vous concentrer. Flow essaie de résoudre ce problème avec trois grands efforts : un meilleur contrôle, une compatibilité cross-média et moins de silos.
Tout d’abord ? Flow cesse d’être une simple boîte de dialogue. Cela devient un agent conversationnel. Propulsé par Gemini, il mémorise l’historique de votre projet. Il agit comme une caisse de résonance. Coincé dans le dialogue ? L’IA peut réfléchir avec vous aux points de tracé. Il s’agit moins de générer des clips ponctuels que d’une collaboration de longue durée.
Ensuite, il y a les Flow Tools. Vous pouvez coder des flux de travail personnalisés en utilisant un anglais simple. Aucun JavaScript requis. Vous voulez un redimensionneur vidéo spécifique ou un effet de shader étrange ? Décrivez-le simplement. Construisez-le. Partagez-le. La fonctionnalité transforme les utilisateurs en mini-développeurs sans le casse-tête du développeur.
Le véritable changement n’est pas la vitesse. C’est l’agence. Vous dites à l’outil ce que vous voulez, pas comment le calculer.
Le moteur qui l’alimente est Gemini Omni Flash. Google l’appelle en plaisantant « Nano Banana », ce qui n’est probablement pas leur meilleur choix en matière de relations publiques. Mais c’est une technologie sérieuse. Il apporte un montage vidéo à vidéo précis. Plus important encore, il gère la cohérence des caractères. Si votre avatar a une cicatrice dans la première scène, il a cette cicatrice dans la deuxième scène. Le modèle est désormais disponible pour les abonnés mondiaux de Google AI.
Roman a donné une démo qui ressemblait moins à un argumentaire de vente qu’à un tour de magie. Il a construit de toutes pièces une scène de Times Square des années 1980. Il a imposé des contraintes strictes, comme intégrer un pinscher nain dans chaque plan comme un œuf de Pâques. Il a monté des vidéos côte à côte avec des commandes de texte. Il a rendu les caractères artistiques ASCII à la volée. Le système n’a pas cligné.
Oh, et ils ont créé des applications mobiles. Enfin. Flow est en version bêta sur Android (iOS arrive). Flow Music est en ligne sur iOS (Android est en attente). Les créateurs peuvent désormais réfléchir tout en faisant la queue devant un café.
La musique fait l’objet d’un traitement précis
Flow Music a aussi un peu d’amour. Habituellement, les générateurs de musique IA sont des instruments contondants. Vous invitez « happy jazz » et priez pour le meilleur. Google veut plutôt vous donner un scalpel.
Vous pouvez désormais éditer des parties d’une chanson individuellement. Vous voulez changer les paroles tout en gardant le rythme ? Facile. Vous souhaitez traduire le chant dans une autre langue sans altérer la mélodie ? Faisable. Vous ne régénérez pas la piste entière à partir de zéro à chaque fois. Cela fait gagner du temps et maintient l’ambiance cohérente.
Ensuite, il y a la fonction de couverture. Il vous permet de prendre un morceau existant (en conservant la mélodie et la structure) et d’échanger le genre. Transformez un hymne pop en rythmes lo-fi. La structure reste, la saveur change.
Enfin, Omni Flash arrive aux vidéoclips. Vous n’obtenez pas seulement une piste audio. Vous pouvez demander par conversation à un compagnon visuel de l’accompagner. Dites à l’IA que vous voulez des néons, une ruelle pluvieuse ou un coucher de soleil synthwave. Il construit les scènes en fonction de l’ambiance de votre chanson. Disponible dès maintenant pour les abonnés.
Et maintenant ? Nous avons une IA qui se souvient de nous, nous parle et édite à nos côtés. Cela semble puissant. Aussi, peut-être un peu énervant ?






























