Google setzt wieder stark auf Kreativität. Die diesjährige I/O-Entwicklerkonferenz brachte nicht nur Optimierungen. Es brachte Überholungen mit sich. Das Unternehmen verstärkt Flow, das letztes Jahr gegründete KI-Kreativstudio, und Flow Music, seine Schwesterplattform zur Klangerzeugung. Das Ziel? Damit sich das Erstellen von Dingen weniger wie ein Kampf gegen Software anfühlt, sondern eher wie ein Partner.
Letztes Jahr hat Google Flow als „für Kreative, von Kreativen“-Hub gepriesen. Es versprach, den Bedarf an einem halben Dutzend verschiedener Apps zu eliminieren. Anstatt zwischen Tools für Video, Animation und Bearbeitung hin und her zu wechseln, bleiben Sie an einem Ort. Jetzt halten sie dieses Versprechen mit Funktionen ein, die es der KI ermöglichen, Sie während des gesamten Prozesses tatsächlich an der Hand zu halten.
Flow bekommt ein Gehirn (und ein Gedächtnis)
Elias Roman, Senior Director of Product Management bei Google, sagte, YouTuber hassen fragmentierte Arbeitsabläufe. Er nannte es das Ende des „Flow-Zustandes“. Der Wechsel zwischen teuren Einzweck-Apps unterbricht Ihren Fokus. Flow versucht, dies mit drei großen Schritten zu beheben: bessere Kontrolle, medienübergreifende Kompatibilität und weniger Silos.
Zuerst? Flow ist nicht mehr nur eine Eingabeaufforderung. Es wird zu einem Gesprächsagenten. Unterstützt durch Gemini, merkt es sich Ihren Projektverlauf. Es wirkt wie ein Resonanzboden. Sie stecken im Dialog fest? Die KI kann mit Ihnen ein Brainstorming zu Handlungspunkten durchführen. Dabei geht es weniger um die Generierung einmaliger Clips als vielmehr um eine langfristige Zusammenarbeit.
Dann gibt es noch Flow Tools. Sie können benutzerdefinierte Workflows in einfachem Englisch programmieren. Kein JavaScript erforderlich. Möchten Sie einen bestimmten Video-Resizer oder einen seltsamen Shader-Effekt? Beschreiben Sie es einfach. Baue es. Teilt es. Die Funktion verwandelt Benutzer in Mini-Entwickler, ohne dass Entwickler Kopfschmerzen haben müssen.
Der eigentliche Unterschied ist nicht die Geschwindigkeit. Es ist die Agentur. Sie sagen dem Tool, was Sie wollen, nicht, wie es es berechnen soll.
Der Motor, der dies antreibt, ist Gemini Omni Flash. Google nannte es scherzhaft „Nano Banana“, was wahrscheinlich nicht die beste PR-Wahl ist. Aber es ist ernstzunehmende Technik. Es ermöglicht eine präzise Video-zu-Video-Bearbeitung. Noch wichtiger ist, dass es die Charakterkonsistenz gewährleistet. Wenn Ihr Avatar in Szene eins eine Narbe hat, hat er diese Narbe auch in Szene zwei. Das Modell ist jetzt für globale Google AI-Abonnenten verfügbar.
Roman gab eine Demo, die sich weniger wie ein Verkaufsargument, sondern eher wie ein Zaubertrick anfühlte. Er baute eine Szene am Times Square der 1980er Jahre von Grund auf auf. Er erzwang strenge Auflagen – wie zum Beispiel die Einbettung eines Zwergpinschers als Osterei in jede Aufnahme. Er bearbeitete Side-by-Side-Videos mit Textbefehlen. Er hat ASCII-Kunstzeichen im Handumdrehen gerendert. Das System blinkte nicht.
Oh, und sie haben mobile Apps entwickelt. Endlich. Flow befindet sich in der Beta-Version für Android (iOS kommt bald). Flow Music ist live auf iOS (Android steht noch aus). Kreative können jetzt Brainstorming betreiben, während sie beim Kaffee in der Schlange stehen.
Musik wird präzise behandelt
Flow Music hat auch etwas Liebe bekommen. Normalerweise sind KI-Musikgeneratoren stumpfe Instrumente. Sie sagen „Happy Jazz“ und beten für das Beste. Google möchte Ihnen stattdessen ein Skalpell in die Hand geben.
Sie können jetzt Teile eines Songs einzeln bearbeiten. Möchten Sie den Text ändern, aber den Takt beibehalten? Einfach. Möchten Sie den Gesang in eine andere Sprache übersetzen, ohne die Melodie zu verändern? Machbar. Sie regenerieren nicht jedes Mal die gesamte Spur von Grund auf. Das spart Zeit und sorgt für eine gleichbleibende Stimmung.
Dann gibt es noch die Cover-Funktion. Sie können einen vorhandenen Titel übernehmen und dabei die Melodie und Struktur beibehalten und das Genre austauschen. Verwandeln Sie eine Pop-Hymne in Lo-Fi-Beats. Die Struktur bleibt, der Geschmack verändert sich.
Endlich kommt Omni Flash zu Musikvideos. Sie erhalten nicht nur eine Audiospur. Sie können einen visuellen Begleiter im Gespräch dazu anweisen. Sagen Sie der KI, dass Sie Neonlichter, eine verregnete Gasse oder einen Synthwave-Sonnenuntergang wünschen. Es baut die Szenen so auf, dass sie zur Stimmung Ihres Songs passen. Ab sofort für Abonnenten verfügbar.
Was nun? Wir haben eine KI, die sich an uns erinnert, mit uns spricht und neben uns bearbeitet. Es fühlt sich kraftvoll an. Vielleicht auch etwas nervig?
