O Google está apostando alto na criatividade novamente. A conferência de desenvolvedores I/O deste ano não trouxe apenas ajustes. Trouxe revisões. A empresa está dobrando a aposta no Flow, o estúdio criativo de IA lançado no ano passado, e no Flow Music, sua plataforma irmã para geração de som. O objetivo? Para fazer com que a criação de coisas pareça menos uma luta contra software e mais como ter um parceiro.
No ano passado, o Google lançou o Flow como um centro “para criativos, por criativos”. Prometeu eliminar a necessidade de meia dúzia de aplicativos diferentes. Em vez de alternar entre ferramentas de vídeo, animação e edição, você permaneceria em um só lugar. Agora, eles estão cumprindo essa promessa com recursos que realmente permitem que a IA controle você durante todo o processo.
Flow ganha um cérebro (e uma memória)
Elias Roman, diretor sênior de gerenciamento de produtos do Google, disse que os criadores odeiam fluxos de trabalho fragmentados. Ele chamou isso de fim do “estado de fluxo”. Alternar entre aplicativos caros e de propósito único quebra seu foco. A Flow está tentando consertar isso com três grandes iniciativas: melhor controle, compatibilidade entre mídias e menos silos.
Primeiro? O fluxo deixa de ser apenas uma caixa de prompt. Está se tornando um agente conversacional. Desenvolvido pela Gemini, ele lembra o histórico do seu projeto. Funciona como uma caixa de ressonância. Preso no diálogo? A IA pode discutir pontos da trama com você. Trata-se menos de gerar clipes únicos e mais de colaboração de formato longo.
Depois, há Ferramentas de fluxo. Você pode codificar fluxos de trabalho personalizados usando inglês simples. Não é necessário JavaScript. Quer um redimensionador de vídeo específico ou um efeito de shader estranho? Apenas descreva. Construa. Compartilhe. O recurso transforma os usuários em minidesenvolvedores sem a dor de cabeça do desenvolvedor.
A verdadeira mudança não é a velocidade. É a agência. Você diz à ferramenta o que deseja, não como calculá-lo.
O motor que alimenta isso é o Gemini Omni Flash. O Google, brincando, chamou-o de “Nano Banana”, o que provavelmente não é sua melhor escolha de relações públicas. Mas é uma tecnologia séria. Ele traz edição precisa de vídeo para vídeo para a mesa. Mais importante ainda, ele lida com a consistência dos personagens. Se o seu avatar tiver uma cicatriz na cena um, ele terá aquela cicatriz na cena dois. O modelo já está disponível para assinantes globais do Google AI.
Roman fez uma demonstração que parecia menos um discurso de vendas e mais um truque de mágica. Ele construiu uma cena da Times Square dos anos 1980 do zero. Ele impôs restrições rígidas – como incorporar um pinscher miniatura em cada foto como um ovo de Páscoa. Ele editou vídeos lado a lado com comandos de texto. Ele renderizou caracteres de arte ASCII instantaneamente. O sistema não piscou.
Ah, e eles criaram aplicativos móveis. Finalmente. O Flow está em beta no Android (iOS está chegando). Flow Music está disponível no iOS (Android está pendente). Os criadores agora podem fazer brainstorming enquanto estão na fila do café.
Música recebe tratamento preciso
Flow Music também ganhou um pouco de amor. Normalmente, os geradores de música de IA são instrumentos contundentes. Você solicita “happy jazz” e ora pelo melhor. Em vez disso, o Google quer lhe dar um bisturi.
Agora você pode editar partes de uma música individualmente. Quer mudar a letra, mas manter o ritmo? Fácil. Quer traduzir os vocais para outro idioma sem alterar a melodia? Factível. Você não está regenerando toda a faixa do zero todas as vezes. Isso economiza tempo e mantém a vibração consistente.
Depois, há o recurso de capa. Ele permite que você pegue uma faixa existente – mantendo a melodia e a estrutura – e troque de gênero. Transforme um hino pop em batidas lo-fi. A estrutura permanece, o sabor muda.
Por fim, Omni Flash chega aos videoclipes. Você não obtém apenas uma faixa de áudio. Você pode direcionar em conversação um companheiro visual para acompanhá-lo. Diga à IA que você quer luzes de néon, um beco chuvoso ou um pôr do sol com ondas sintéticas. Ele constrói as cenas para combinar com o clima da sua música. Já disponível para assinantes.
E agora? Temos uma IA que se lembra de nós, fala conosco e edita conosco. Parece poderoso. Além disso, talvez um pouco enervante?
