KI-Creatives mit Veo 3, Runway & Flux für Google Ads 2026

Key takeaway

KI-Creative-Generierung veränderte die Ökonomie von Google-Ads-Creatives in 2026: Kosten und Zeit, um eine getestete Variante zu produzieren, brachen ein, was enorm für Performance Max und Demand Gen zählt, die Formate, die Creative-Volumen verschlingen, um Gewinner zu finden. Die drei Tools, die eine praktische Pipeline verankern, sind Veo 3 (Googles Videomodell, hochkohärente Clips mit nativem Audio, integriert sich mit dem Google-Ökosystem), Runway (die stärkere Wahl, wenn Sie Schnittkontrolle brauchen — Motion-Direction, Video-zu-Video, Sequenzkonsistenz) und Flux (schnelle, günstige, steuerbare Bildgenerierung im großen Maßstab). Sie sind komplementär, nicht konkurrierend — die meisten echten Pipelines nutzen alle drei plus ein Hero-Asset aus traditioneller Produktion. Der Gewinn ist nicht der Feinschliff eines einzelnen Assets; es ist, das volle Set an Seitenverhältnissen (16:9, 1:1, 9:16) und Längen (6s, 15s, 30s) eines Konzepts günstig genug zu produzieren, um jedes Placement zu füllen und dem Algorithmus Dutzende Varianten zum Testen zu geben. Der schwere Teil ist nicht die Generierung — es ist das Brand-Briefing, das den Output steuert, das menschliche Kuratierungs-Gate, das das Off-Brand und das Glitchige ablehnt, und die Rechte-/Offenlegungsdisziplin rund um KI-generierte Personen.

Ein Jahrzehnt lang war die bindende Beschränkung von Google-Ads-Creatives die Produktionskosten. Eine Performance-Max-Asset-Gruppe richtig zu füllen — mehrere Bilder in jedem Seitenverhältnis, Video in drei Orientierungen, mehrere Längen — bedeutete entweder einen echten Dreh mit seinem echten Budget oder einen Long Tail von Asset-Lücken, die der Algorithmus nie testen konnte. Bis 2026 ließ KI-Generierung diese Beschränkung einbrechen. Veo 3, Runway und Flux machten es günstig und schnell, das Variantenvolumen zu produzieren, das PMax und Demand Gen zu konsumieren gebaut sind, und das verschob den Engpass von „Können wir uns leisten, das zu machen" zu „Können wir gut genug kuratieren und briefen, um es gut zu machen".

Dieser Guide ist ein praktischer Walkthrough für Creative- und Growth-Teams, die eine KI-Creative-Pipeline für Google Ads fahren wollen. Er ist handfest statt spekulativ: wie die drei Tools abschneiden und wo jedes passt, der Workflow vom Briefing zum freigegebenen Asset, die exakten Asset-Specs für Demand Gen, Performance Max und YouTube und die Kosten-, Rechte- und Offenlegungsrealitäten, das auf Account-Ebene zu fahren. Das Publikum sind Leute, die Creatives für Live-Kampagnen produzieren, keine Forscher — der Fokus liegt auf dem, was ausgeliefert wird und performt.

Volumen schlägt Feinschliff — bei den Varianten, nicht beim Hero :

Der Instinkt aus der traditionellen Produktionsära ist, ein schönes Asset zu machen. Dieser Instinkt ist genau falsch für die Formate, die jetzt die Google-Ads-Auslieferung dominieren. Performance Max und Demand Gen sind Varianten-Testmaschinen: sie nehmen viele Assets, kombinieren sie, liefern die Kombinationen aus und konzentrieren Spend auf das, was funktioniert. Die Aufgabe des Werbetreibenden ist, der Maschine genug gute, on-brand Variation zu geben, um Gewinner zu finden — und die Superkraft von KI-Creative ist, diese Variation günstig zu produzieren. Ein Team, das ein poliertes Hero und drei Asset-Gruppen-Füller ausliefert, verliert gegen ein Team, das ein poliertes Hero und vierzig getestete KI-Varianten ausliefert, weil das zweite Team dem Algorithmus einen echten Suchraum gab. Reservieren Sie Handwerk und menschliche Produktion für das Hero, das die Brand trägt; nutzen Sie KI, um die getesteten Varianten darum herum zu vervielfachen. Der Fehler ist, das zu invertieren — KI für das Hero zu nutzen und am Variantenvolumen zu sparen, das die Performance tatsächlich bewegt.

Warum KI-Creatives die Google-Ads-Ökonomie 2026 veränderten

Um zu verstehen, warum KI-Creatives speziell für Google Ads so stark zählen — mehr als etwa für einen einzelnen Brand-Film — müssen Sie verstehen, wie moderne Google-Ads-Kampagnentypen Creatives konsumieren.

Performance Max und Demand Gen schalten nicht „eine Anzeige". Sie schalten Asset-Gruppen: Sammlungen von Bildern, Videos, Headlines, Descriptions und Logos, die das System in viele mögliche Anzeigen-Permutationen kombiniert, über das gesamte Google-Inventar ausliefert (Search, Shopping, YouTube, Discover, Gmail, Display, Maps), misst und auf die performenden Kombinationen optimiert. Je mehr — und je variierter — die Assets, die Sie liefern, desto größer der Suchraum, den der Algorithmus erkunden kann, und desto besser die Gewinnerkombination, die er finden kann. Eine Asset-Gruppe mit zwei Bildern und einem Video gibt dem Algorithmus fast nichts zu optimieren; eine mit einem Dutzend Bildern über Seitenverhältnisse und mehreren Videos über Orientierungen gibt ihm echten Spielraum.

In der traditionellen Produktionsära war das richtige Füllen von Asset-Gruppen teuer genug, dass die meisten Werbetreibenden sie unterversorgten. Ein Dreh produzierte ein Hero-Video und eine Handvoll Stills; diese in die volle Matrix aus 16:9-, 1:1- und 9:16-Videoschnitten und 1,91:1-, 1:1- und 4:5-Bildausschnitten zu verwandeln, bedeutete mehr Schnittbudget, also lieferten Teams partielle Asset-Gruppen und ließen Performance auf dem Tisch. Die Asset-Coverage-Lücke war ein direkter, messbarer Bremsklotz für PMax- und Demand-Gen-Ergebnisse.

KI-Creative entfernt die Kostenbarriere zum Füllen dieser Matrix. Die vertikalen, quadratischen und horizontalen Schnitte eines Konzepts zu generieren, oder vierzig on-brand Hintergrundvariationen zu produzieren, oder einen 6-Sekunden- und einen 15-Sekunden-Schnitt derselben Idee zu machen, kostet jetzt Cent und Minuten statt Hunderte Euro und Tage. Das ändert die Strategie: statt Creatives zu rationieren, weil sie teuer sind, produzieren Sie Überfluss, weil er günstig ist, und lassen den Algorithmus sortieren. Die ökonomische Verschiebung geht von knappheitsgetriebenen Creatives (wenige machen, sie zählen lassen) zu überflussgetriebenen Creatives (viele machen, rücksichtslos testen, Gewinner behalten).

Es gibt einen Effekt zweiter Ordnung: Creative-Refresh-Kadenz. Anzeigen-Creatives ermüden — Performance verfällt, während Audiences dieselben Assets wiederholt sehen. Im traditionellen Modell war Refresh langsam und teuer, also liefen Creatives oft lange über ihren Höhepunkt hinaus. Mit einer KI-Pipeline ist das Refreshen des Variantensets günstig genug, um es in regelmäßiger Kadenz zu tun, was Fatigue in Schach hält und dem Algorithmus frisches Material zum Testen gibt. Die Kombination aus günstigem Anfangsvolumen und günstigem Refresh ist das, was KI-Creative für Google Ads zu einem ökonomischen Stufensprung statt einer marginalen Verbesserung macht.

Nichts davon bedeutet, dass Feinschliff aufhörte zu zählen. Es bedeutet, dass Feinschliff dahin wanderte, wo er zählt — das Hero-Asset und das Brand-Handwerk — während die hochvolumige, Multi-Seitenverhältnis-, häufig refreshte Variantenschicht, von der PMax und Demand Gen leben, günstig in Qualität produzierbar wurde. Diese Reallokation ist die eigentliche Geschichte von KI-Creative in Google Ads.

Die drei Tools: Veo 3, Runway, Flux im Vergleich

Die drei Tools, die eine praktische 2026-Google-Ads-Creative-Pipeline verankern, besetzen jeweils eine eigene Rolle. Die Arbeitsteilung zu verstehen zählt mehr, als ein einzelnes „bestes" Tool zu wählen, weil eine echte Pipeline alle drei nutzt.

Veo 3 ist Googles Flaggschiff-Videogenerierungsmodell, zugänglich über die Gemini-App, das Flow-Filmmaking-Tool, Google AI Studio und Vertex AI für programmatische Nutzung. Seine herausragenden Eigenschaften für Advertising sind hohe temporale Kohärenz (Objekte und Szenen bleiben über den Clip konsistent, statt zu morphen) und native Audio-Generierung (es kann synchronisierten Sound und sogar Sprache produzieren), was die meisten konkurrierenden Modelle nicht nativ taten. Für ein Google-Ads-Team ist Veos Ökosystem-Passung ein echter Vorteil: es ist derselbe Vendor wie die Ad-Plattform, der Output ist darauf ausgelegt, in YouTube- und Demand-Gen-Kontexten zu funktionieren, und der Vertex-AI-Pfad unterstützt programmatische Generierung im großen Maßstab.

Runway (die Gen-4-Generation von Modellen und ihr Tooling) ist die kontrollorientierte Wahl. Wo Veo bei „generiere einen kohärenten Clip aus einem Prompt" glänzt, glänzt Runway beim Dirigieren der Generierung: Motion Brushes, um zu kontrollieren, was sich bewegt und wie, Kamerabewegungs-Kontrollen, Video-zu-Video-Restyling (einen echten Clip nehmen und restylen) und Tooling, um Konsistenz über eine Multi-Shot-Sequenz zu halten. Das ist es, wonach Sie greifen, wenn Sie ein gestaltetes, kontrolliertes Ergebnis statt einer schnellen Variante brauchen — die Shots, bei denen die Absicht des Regisseurs zählt. Runway ist ein Produktionstool mit KI darin, mehr als eine Prompt-zu-Clip-Box.

Flux (die Flux-Familie von Bildmodellen von Black Forest Labs) ist das Bildgenerierungs-Workhorse: schnell, hochqualitativ, steuerbar und günstig pro Bild über API-Anbieter und Apps. Für Google Ads, wo Bild-Assets viele Seitenverhältnisse über Demand Gen und PMax spannen, ist Flux' Wert Volumen bei Qualität mit Reference-Conditioning-Support — Sie konditionieren die Generierung auf freigegebenes Brand-Bildmaterial, um Output on-brand zu halten, und Sie generieren die Dutzenden Bildvarianten und Seitenverhältnis-Ausschnitte, die eine Asset-Gruppe will, für Cent pro Stück.

Die Arbeitsteilung in einer typischen Pipeline: Flux produziert das Bildvarianten-Volumen über jedes Seitenverhältnis; Veo 3 produziert schnelle, kohärente Base-Video-Clips mit Sound für die Workhorse-Video-Placements; Runway handhabt die Shots, die Regie-Kontrolle oder Restyling brauchen; und traditionelle Produktion (oder ein High-Touch-Runway-/Veo-Workflow) produziert das eine Hero-Asset, das die Brand-Kampagne verankert. Alles in einem Tool zu versuchen produziert schlechtere Ergebnisse, als jedes für seine Stärke zu nutzen — Flux für Bilder, Veo für schnelles Video, Runway für kontrolliertes Video.

Veo 3 für Video: was es gut und schlecht macht

Veo 3 ist der Ort, wo die meisten Google-Ads-Teams den Großteil ihres Videos produzieren, also lohnt es sich, seine Stärken und Failure Modes präzise zu kennen.

Was Veo 3 gut macht. Temporale Kohärenz ist seine Headline-Stärke — ein generierter Clip hält über seine Dauer zusammen, mit Objekten, Beleuchtung und Szene, die konsistent bleiben, statt des Morphens und Flackerns, das frühere Videomodelle plagte. Natives Audio ist die zweite: Veo kann synchronisierte Soundeffekte, Ambient-Audio und Sprache generieren, was bedeutet, dass ein Clip näher an fertig ankommt, statt einen separaten Audio-Pass zu brauchen. Prompt-Adhärenz ist stark für Szenenkomposition und Action. Und die Ökosystem-Integration — Generierung über Vertex AI für programmatische Pipelines oder über Flow für einen stärker dirigierten Filmmaking-Workflow — gibt Teams sowohl einen Skalierungspfad als auch einen Handwerkspfad.

Was Veo 3 schlecht macht (die Failure Modes, gegen die zu kuratieren ist). Textrendering innerhalb des Videos bleibt unzuverlässig — Bildschirmtext kommt häufig verstümmelt heraus, also verlassen Sie sich nicht auf das Modell, um Ihren Tagline oder Produktnamen zu rendern; fügen Sie Text stattdessen in Post hinzu. Gesichter und Hände, die klassischen Schwachstellen generativer KI, produzieren weiterhin gelegentlich uncanny oder anatomisch falsche Ergebnisse, besonders in Close-up und Bewegung. Physik kann glitchen — Objekte, die durcheinander gehen, unplausible Bewegung, Flüssigkeiten, die sich falsch verhalten — besonders in komplexen Szenen. Präzise Produkttreue ist schwer: hat Ihr Produkt exaktes Branding, Proportionen oder Detail, das akkurat sein muss, wird das Modell es approximieren, und diese Approximation ist eventuell nicht akkurat genug für eine Produktdemo. Und feingranulare Regie-Kontrolle (exakte Kamerabewegungen, präzises Timing) ist schwächer als in einem kontrollorientierten Tool wie Runway.

Die praktische Workflow-Implikation: Veo 3 ist exzellent zum Generieren von Base-Clips — Szenen, Stimmungen, B-Roll, Lifestyle-Kontext — die Sie dann fertigen, mit Text und präzisen Produkt-Shots, in Post hinzugefügt. Es ist schwächer als One-Shot-Fertig-Anzeigen-Generator. Die Teams, die das Meiste daraus holen, generieren viele kurze Base-Clips, kuratieren hart gegen die Failure Modes (lehnen die verstümmelt-Text-, die falsch-Hände-, die Physik-Glitch-Outputs ab) und montieren die Überlebenden zu fertigen Anzeigen, mit Text und Produktgenauigkeit separat gehandhabt.

Eine Anmerkung zur nutzbaren Rate: früh in einer Pipeline erwarten Sie grob 1 von 5 bis 1 von 10 Veo-Generierungen nutzbar nach Kuratierung, sich verbessernd, während Sie die Prompt-Muster lernen, die die Failure Modes vermeiden. Das ist normal und der Grund, warum Kuratierungsarbeit, nicht Generierungskosten, das Budget dominiert. Bauen Sie den Kuratierungsschritt in den Workflow ein, statt jede Generierung als auslieferungsfähig zu behandeln.

Eine Workflow-Taktik, die die nutzbare Rate schnell hebt: in kleinen Batches um einen einzelnen straff spezifizierten Prompt generieren, den besten Output wählen, dann den Prompt basierend auf dem iterieren, was fehlschlug, statt alles auf einmal zu ändern. Veo reagiert gut auf spezifische Szenenbeschreibung (Subjekt, Action, Setting, Beleuchtung, Kamerarahmung, Stimmung) und schlecht auf vage Creative-Direction, also tendieren die Prompt-Muster, die in Ihre Template-Bibliothek überleben, dazu, konkret und strukturiert zu sein. Halten Sie eine laufende Notiz, welche Formulierungen die Failure Modes zuverlässig vermeiden — etwa Rahmung, die Gesichter auf Mitteldistanz statt extremem Close-up hält, oder Szenen ohne Bildschirmtext-Abhängigkeit — und speisen Sie diese Erkenntnisse zurück ins Briefing, damit das ganze Team profitiert.

Runway für Videoschnitt und Kontrolle

Runway verdient sich seinen Platz in der Pipeline, wenn Prompt-zu-Clip-Generierung nicht genug ist — wenn Sie das Ergebnis dirigieren müssen. Sein Toolset ist um Kontrolle statt reine Generierung gebaut, was es zum richtigen Tool für die stärker gestalteten Shots in einer Kampagne macht.

Motion- und Kamerakontrolle. Runway lässt Sie spezifizieren, was sich bewegt und wie — Motion Brushes, um anzuzeigen, welche Teile eines Frames animieren sollen und in welche Richtung, und Kamerakontrollen, um Pans, Zooms und Dolly-Bewegungen zu dirigieren. Für einen Werbetreibenden zählt das, wenn der Shot Absicht hat: ein kontrollierter Push-in auf ein Produkt, eine spezifische Bewegung, die dem Konzept dient, statt was auch immer das Modell zu animieren beschließt. Diese Regie-Kontrolle ist der Unterschied zwischen einem generierten Clip und einem gestalteten.

Video-zu-Video und Restyling. Eine von Runways nützlichsten Advertising-Fähigkeiten ist, einen bestehenden Clip zu nehmen — ein echter Produkt-Shot, ein Stück Stock, ein vorheriges Render — und ihn zu restylen, während Struktur und Bewegung erhalten bleiben. Das lässt Sie Produktgenauigkeit halten (von einem echten Shot ausgehen), während Sie eine konsistente stilistische Behandlung über eine Kampagne anwenden, und umgehen die Produkttreue-Schwäche von reinem Text-zu-Video.

Sequenzkonsistenz. Für ein Multi-Shot-Stück ist es schwer, Charaktere, Settings und Stil über Shots mit One-Shot-Generierung konsistent zu halten. Runways Tooling für Referenz und Konsistenz über eine Sequenz ist stärker, was es zur besseren Wahl macht, wenn ein Video eine kleine Story über mehrere Shots erzählt, statt in einem einzelnen Clip zu leben.

Die Rolle, die Runway in der Pipeline spielt: es handhabt die Shots zwischen „schneller Base-Clip" (Veos Job) und „voller traditioneller Produktion" (Heros Job) — die kontrollierten, gestalteten, sequenzkonsistenten Shots, die mehr Regie als einen Prompt, aber weniger als ein Filmteam brauchen. In der Praxis nutzen viele Teams Runway für das brand-nahe Video, das sich gestaltet anfühlen muss, und Veo für die hochvolumigen Base-Clips. Beide bewusst zu nutzen — Veo für Geschwindigkeit und Volumen, Runway für Kontrolle und Handwerk — produziert ein besseres Ergebnis, als eines der Tools zu zwingen, den Job des anderen zu tun.

Dieselbe Kuratierungsdisziplin gilt: selbst mit mehr Kontrolle braucht Runway-Output menschliche Prüfung gegen die Brand-Checkliste, bevor er ausgeliefert wird. Kontrolle reduziert die Failure-Rate; sie eliminiert nicht den Bedarf an einem Gate.

Flux für Bildgenerierung im großen Maßstab

Bild-Assets sind der volumenstärkste Creative-Bedarf in Google Ads — jede Demand-Gen- und Performance-Max-Asset-Gruppe will mehrere Bilder in mehreren Seitenverhältnissen, und dieser Bedarf multipliziert sich über Kampagnen und Refresh-Zyklen. Flux ist das Tool, das ihn ökonomisch erfüllt.

Warum Flux für Anzeigenbilder. Flux liefert hohe Bildqualität mit starker Prompt-Adhärenz zu Kosten von Cent pro Bild über API-Anbieter, was genau das Profil ist, das eine hochvolumige Bildpipeline braucht. Es handhabt die Dinge, die Anzeigenbilder verlangen — saubere Kompositionen, Produkt-Kontext-Szenen, Lifestyle-Bildmaterial, Hintergründe — und tut das schnell genug, um Dutzende Varianten in der Zeit zu generieren, die ein Designer für eine bräuchte.

Reference Conditioning für Brand-Konsistenz. Flux' Support für Referenz-/Conditioning-Bilder ist das, was es für Brand-Arbeit nutzbar macht statt generischem Stock-artigem Output. Indem Sie die Generierung auf freigegebenes Brand-Bildmaterial konditionieren — Ihre Farbbehandlung, Ihr Produkt, Ihren visuellen Stil — halten Sie Output on-brand, statt sich auf die Defaults des Modells zu verlassen, die generisch driften. Das ist der technische Mechanismus hinter Brand-Konsistenz: nicht hoffen, dass der Prompt detailliert genug ist, sondern die Generierung auf Referenzen konditionieren, die die Brand visuell kodieren.

Seitenverhältnis-Abdeckung. Das einzelne wertvollste, das Flux für eine Google-Ads-Pipeline tut, ist, dasselbe Konzept günstig über jedes erforderliche Seitenverhältnis zu produzieren: das 1,91:1-Landscape, das 1:1-Square, das 4:5-Portrait plus die Logo-Verhältnisse. In traditioneller Produktion ist jeder Ausschnitt Designarbeit; mit Flux ist ein Konzept über Verhältnisse zu generieren oder anzupassen ein paar Generierungen und ein Kuratierungs-Pass. Das ist genau die Asset-Coverage-Lücke, die früher die PMax-Performance bremste, günstig geschlossen.

Der Workflow. Einen Konzept-Batch konditioniert auf Referenzen generieren, gegen die Brand-Checkliste kuratieren (on-palette, produktgenau, keine Artefakte, keine unbeabsichtigte Likeness), dann das Seitenverhältnis-Set für die Überlebenden produzieren. Taggen und versionieren Sie die freigegebenen Bilder, damit Sie Gewinner später aus den Asset-Performance-Daten identifizieren können. Die nutzbare Rate für Bilder ist typischerweise höher als für Video — Bildgenerierung ist reifer und die Failure Modes sind besser abfangbar — aber das Kuratierungs-Gate gilt weiterhin. Flux verwandelt die Bildseite einer Asset-Gruppe von einer Budgetposition in einen schnellen, günstigen, on-brand Produktionsschritt, was genau das ist, was hochvolumige Google-Ads-Creatives brauchen.

Der Workflow vom Briefing zum freigegebenen Asset

Die Tools sind nicht der schwere Teil. Der Workflow, der ein Briefing in freigegebene, on-brand, performance-bereite Assets verwandelt, ist der Ort, wo Pipelines gelingen oder scheitern. Sechs Stufen, jede mit einem klaren Job.

Stufe 1: Das Briefing. Alles startet mit einem straffen, wiederverwendbaren Brand-Briefing. Es spezifiziert die Palette als exakte Hex-Werte, die Typografie, Logo-Nutzung und -Platzierung, die Tonalität, die verbindlichen Produktgenauigkeitsregeln und — entscheidend — eine explizite Verbotsliste: keine implizierten Endorsements, kein Off-Palette-Output, keine ungenaue Produktdarstellung, keine unbeabsichtigte Likeness. Ein vages Briefing produziert Off-Brand-Output, egal wie fähig das Modell ist; das Briefing ist das Brand-Schutzgeländer. Es ist auch wiederverwendbar: einmal geschrieben, steuert es jede Generierung und wird nur verfeinert, während Sie lernen.

Stufe 2: Referenzsammlung. Sammeln Sie freigegebenes Brand-Bildmaterial, um Flux- und Runway-Generierung zu konditionieren. Referenzen sind, wie Brand-Konsistenz technisch durchgesetzt statt erhofft wird — das Modell konditioniert auf Ihre tatsächlichen Brand-Visuals statt seiner generischen Defaults.

Stufe 3: Generierung. Produzieren Sie den Konzept-Batch: Bildkonzepte in Flux konditioniert auf Referenzen, Base-Video-Clips in Veo 3, kontrollierte Shots in Runway. Erwarten Sie eine nutzbare Rate von 1 von 5 bis 1 von 10 früh, sich verbessernd mit gelernten Prompt-Mustern. Generierung ist günstig; diese Stufe ist schnell.

Stufe 4: Das Kuratierungs-Gate. Der wichtigste menschliche Schritt. Jede Generierung wird gegen eine Brand-Checkliste geprüft, bevor sie weiterkommt: on-palette, produktgenau, keine Anatomie- oder Physik-Glitches, kein verstümmelter Text, keine unbeabsichtigte Likeness, on-tone. Lehnen Sie rücksichtslos ab — der Algorithmus belohnt ein kleineres Set starker Assets gegenüber einem großen Set mittelmäßiger, und das Ausliefern von Off-Brand- oder geglitchten Assets schadet sowohl Performance als auch Brand. Dieses Gate ist das, was die Pipeline zu einem steuerbaren Produktionssystem statt einem Verkaufsautomaten macht.

Stufe 5: Multi-Seitenverhältnis-Produktion. Produzieren Sie für jedes freigegebene Konzept die volle Matrix an Seitenverhältnissen und Längen, die die Placements brauchen, und konditionieren Sie jeden Schnitt auf dieselbe Referenz für Konsistenz. Hier zahlt sich die Ökonomie von KI-Creative aus — die Schnitte, die traditionelle Produktion dreimal berechnen würde, kosten ein paar Generierungen und einen Kuratierungs-Pass.

Stufe 6: Finishing und Export. Fügen Sie Text und präzise Produkt-Shots in Post hinzu (verlassen Sie sich nicht auf das Modell, um Text oder exaktes Produktdetail zu rendern), exportieren Sie in erforderlichen Auflösungen und halten Sie Provenienz-Metadaten intakt. Taggen und versionieren Sie Assets, damit das spätere Performance-Review Gewinne Konzepten zuordnen kann.

Der rote Faden ist, dass menschliches Urteil von Produktion (die KI jetzt macht) zu Briefing und Kuratierung wandert (die KI nicht kann). Der Mehrwert des Teams verschiebt sich vom Machen jedes Assets von Hand zum Steuern dessen, was das Modell produziert — ein strafferes Briefing, bessere Referenzen und ein strengeres Kuratierungs-Gate produzieren bessere Creatives als jeder Prompt-Engineering-Trick. Teams, die das verinnerlichen, fahren produktive Pipelines; Teams, die KI als magischen Asset-Spender behandeln, liefern Off-Brand-Rauschen.

Der erste Monat KI-Creative des Teams unterperformte ihre alten handgemachten Anzeigen, und sie hätten es fast aufgegeben. Das Problem waren nicht die Tools — es war, dass sie kein Briefing und kein Kuratierungs-Gate hatten, also lieferten sie aus, was auch immer das Modell produzierte. Wir fügten ein einseitiges Brand-Briefing und eine Fünf-Punkte-Kuratierungs-Checkliste hinzu und lehnten acht von je zehn Generierungen ab. Die KI-Varianten des nächsten Monats schlugen die handgemachte Baseline, weil die Überlebenden on-brand waren und es vierzig davon für den Algorithmus zum Testen gab statt vier. KI ersetzte nicht das Urteil des Creative-Teams; sie verlagerte es von der Maus zum Briefing und zum Gate.

— Aus einem 2026-Creative-Pipeline-Aufbau

Asset-Specs für Demand Gen, PMax und YouTube

Assets zu produzieren ist verschwendete Mühe, wenn sie nicht die Specs erfüllen, die die Placements verlangen. Hier sind die Kern-2026-Specs, gegen die zu produzieren ist, organisiert nach dem, was jeder Kampagnentyp konsumiert.

Bild-Assets (Demand Gen und Performance Max). Liefern Sie als Minimum die drei Workhorse-Seitenverhältnisse:

Landscape 1,91:1 — 1200x628 (das klassische Horizontale),
Square 1:1 — 1200x1200,
Portrait 4:5 — 960x1200.

Plus Logo-Assets in 1:1 (1200x1200) und 4:1 (1200x300). Performance Max und Demand Gen belohnen das volle Füllen dieser mit mehreren Bildern pro Verhältnis — mehr Bilder geben dem Algorithmus mehr Kombinationen. Dieser Multi-Verhältnis-Bedarf ist genau das, was Flux wertvoll macht: dasselbe Konzept über alle drei Verhältnisse zu produzieren ist günstig.

Video-Assets (YouTube, Demand Gen, Performance Max). Decken Sie die drei Orientierungen ab, um jedes Placement zu erreichen:

16:9 horizontal — In-Stream und Standard-YouTube,
1:1 square — In-Feed,
9:16 vertikal — Shorts und vertikale Placements, zunehmend die volumenstärkste Fläche.

Auflösung: 1080p Minimum. Zu produzierende Längen:

6-Sekunden-Bumper für Reichweite und Frequenz,
15-30 Sekunden für das Haupt-Workhorse-Video,
längeres skippable In-Stream, wo die Story es rechtfertigt.

Der 9:16-Vertikalschnitt verdient Betonung: das Vertikal-Placement-Volumen ist auf den Punkt gewachsen, an dem eine Kampagne ohne 9:16-Video einen großen Anteil Inventar unangetastet lässt, und Vertikal aus einem horizontalen Dreh zu produzieren ist genau die Art Neu-Schnitt, die KI-Tools günstig machen.

Performance-Max-Asset-Gruppen-Vollständigkeit. PMax belohnt spezifisch eine voll befüllte Asset-Gruppe: mehrere Bilder in jedem Verhältnis, mehrere Videos in jeder Orientierung, mehrere Headlines und Descriptions, Logos. Eine unterbefüllte Asset-Gruppe beschränkt den Algorithmus; eine volle gibt ihm einen echten Suchraum. Die Ökonomie von KI-Creative macht das richtige Füllen der Gruppe zum ersten Mal leistbar, weshalb die Paarung von KI-Produktion mit PMax so produktiv ist. Unser Performance Max Asset-Strategie-Guide deckt ab, wie man Asset-Gruppen strukturiert und die Asset-Performance-Labels liest.

Demand-Gen-Spezifika. Demand Gen (der Nachfolger von Discovery-Kampagnen) läuft über YouTube, Discover und Gmail mit einem visuellen, Feed-Stil-Format. Es will dieselben Bild-Verhältnisse plus Video, und es profitiert von Lifestyle-, In-Kontext-Creative statt Hard-Sell-Produkt-Shots — was KI-Tools, konditioniert auf Brand-Referenzen, gut produzieren.

Die praktische Erkenntnis: bauen Sie ein Spec-Sheet, das jedes erforderliche Verhältnis, jede Länge und Auflösung listet, und produzieren Sie systematisch dagegen für jedes Konzept. Die KI-Pipeline macht das Treffen der vollen Spec-Matrix günstig; die Disziplin ist, das komplette Set statt der bequemen Teilmenge zu produzieren.

Kosten, Rechte und Offenlegung auf Account-Ebene

Eine KI-Creative-Pipeline auf Account-Ebene zu fahren wirft drei praktische Bedenken jenseits der Generierungsqualität auf: was sie kostet, wer die Rechte besitzt und was Sie offenlegen müssen.

Kosten. Die Generierungskosten sind moderat und die Arbeitskosten dominieren. Als 2026-Größenordnungen: Veo-3-Video läuft von ein paar Cent bis ein paar Euro pro nutzbarem Clip je nach Länge, Auflösung und Zugangspfad (Vertex-AI-Pro-Sekunde-Pricing gegenüber Consumer-Tier-Generierungen); Runway verkauft credit-tragende Abos in den Dutzenden bis niedrigen Hunderten Euro monatlich; Flux-Bilder kosten Cent pro Stück über API-Anbieter. Für einen mittelgroßen Account, der 40-80 Varianten im Monat produziert, landen Tool-Credits in den niedrigen Hunderten Euro — aber die echten Kosten sind die Zeit des Creative-Operators zum Briefen, Kuratieren (Ablehnen der Mehrheit der Generierungen) und Fertigen. Budgetieren Sie Kuratierungsarbeit explizit; es ist die Position, die die Output-Qualität bestimmt, und sie ist weit günstiger als die Tausende pro fertigem Video, die traditionelle Produktion kostet. Der ökonomische Case ist stark, aber es ist ein „günstige Tools, bezahltes menschliches Urteil"-Modell, kein kostenloses.

Rechte und Eigentum. Drei Themen zu managen. Erstens Output-Eigentum und kommerzielle Nutzung — die Bedingungen jedes Tools regeln, ob Sie Output kommerziell nutzen können und welche Rechte Sie haben; die Paid-/Commercial-Tiers der großen Tools erlauben Advertising-Nutzung, aber lesen Sie die Bedingungen für Ihren Tier, statt anzunehmen. Zweitens Likeness und Right of Publicity — KI kann versehentlich Output generieren, der einer realen, identifizierbaren Person ähnelt, was Likeness- und False-Endorsement-Exposure schafft; vermeiden Sie das Prompten nach namentlich genannten Personen, prüfen Sie generierte Personen auf unbeabsichtigte Ähnlichkeit und holen Sie für alles, was eine reale Person zeigt, explizite Rechte ein, weil KI nichts am Likeness-Recht ändert. Drittens Trainingsdaten- und IP-Bedenken — es gibt anhaltende rechtliche Unsicherheit rund um Trainingsdaten generativer Modelle; die praktische Abmilderung für Werbetreibende ist, auf Ihre eigenen Brand-Referenzen zu konditionieren, das Prompten im Stil spezifischer lebender Künstler oder erkennbarer IP zu vermeiden und Generierungen original zu Ihrer Brand zu halten.

Offenlegung und Provenienz. Synthetic-Media-Offenlegung verschärft sich, und Werbetreibende müssen damit aktuell bleiben. Kernpunkte: Google verlangt Offenlegung synthetischer Inhalte in sensiblen Kategorien (insbesondere Wahlwerbung, wo KI-veränderter Content offengelegt werden muss) und weitet die Kennzeichnung allgemein aus; KI-Output trägt zunehmend Provenienz-Metadaten (SynthID-Wasserzeichen auf Veo-Output, C2PA Content Credentials), die Plattformen auslesen und anzeigen können — halten Sie diese Metadaten intakt, statt sie zu entfernen; und Regulierung wie der EU AI Act erlegt Transparenzpflichten rund um synthetische Medien auf, die reale Personen zeigen. Die sichere Haltung des Werbetreibenden: sicherstellen, dass Creatives wahrheitsgemäß sind (eine KI-generierte Demo muss zeigen, was das Produkt tatsächlich tut), kategoriespezifische Offenlegungsregeln einhalten, Provenienz-Metadaten bewahren und offenlegen, wenn man bei einer sensiblen Kategorie im Zweifel ist. Wahrhaftigkeit ist der nicht verhandelbare Kern — KI macht es einfach, eine überzeugende Darstellung eines Produkts zu generieren, das etwas tut, was es nicht tut, und das ist sowohl ein Richtlinienverstoß als auch ein Vertrauensrisiko.

Mit Disziplin gehandhabt, gibt eine KI-Creative-Pipeline einem Google-Ads-Account etwas, das er sich vorher nicht leisten konnte: genug on-brand, spec-vollständige, häufig refreshte Creative-Variation, um Performance Max und Demand Gen tatsächlich den Suchraum zu füttern, den sie brauchen — zu einem Bruchteil der traditionellen Kosten, mit dem Urteil des menschlichen Teams umverteilt von Produktion zu Briefing, Kuratierung und der Rechte- und Offenlegungsdisziplin, die es sicher hält.

Wenn Sie ein Review wollen, ob Ihre Creatives Googles Algorithmen tatsächlich die Vielfalt füttern, die sie brauchen — Asset-Gruppen-Vollständigkeit, Seitenverhältnis-Abdeckung und Refresh-Kadenz — neben der Gebots- und Strukturanalyse, fährt SteerAds ein kostenloses 14-Tage-Audit, das ein Creative-Coverage-Review einschließt.

Für verwandte Lektüre siehe unseren Performance Max Asset-Strategie-Guide und unseren Überblick über YouTube- und Video-Anzeigenformate für Google Ads.

Quellen

Offizielle und Drittanbieter-Quellen, die für diesen Guide konsultiert wurden:

deepmind.google/models/veo
— offizielle Veo-Modelldokumentation, Fähigkeiten, Audio-Generierung und SynthID-Wasserzeichen
cloud.google.com/vertex-ai — Videogenerierung
— Veo auf Vertex AI, programmatische Generierung, Pricing-Modell
runwayml.com
— Runway-Gen-4-Fähigkeiten, Motion-/Kamerakontrolle, Video-zu-Video und Credit-Pricing
support.google.com — Asset-Specs
— offizielle Google-Ads-Bild- und -Video-Asset-Spezifikationen für Demand Gen, Performance Max und YouTube
blackforestlabs.ai
— Flux-Bildmodell-Dokumentation, Fähigkeiten und Reference Conditioning

Weiterführende Artikel: Answer Engine Optimization (AEO) for SaaS Vendors 2026 · CTV / Connected TV Ads: SMB Buyer's Guide 2026 · DV360 Setup Checklist: First 90 Days 2026 · GA4 Explorations: Cohort Analysis for Paid Acquisition 2026 · GTM Server Container on Cloud Run: Setup & Cost 2026 · GPT-5 & Claude 4.7 Prompt Library for PPC Managers 2026

FAQ

Welches KI-Tool ist am besten für Google-Ads-Video — Veo 3, Runway oder etwas anderes?

Speziell für Google Ads ist Veo 3 (Googles eigenes Videogenerierungsmodell, verfügbar über die Gemini-App, Google AI Studio und Vertex AI) der natürliche Ausgangspunkt in 2026, weil es hochkohärente Clips mit nativem Audio produziert und sich ins Google-Ökosystem integriert — was zählt, wenn Sie für YouTube und Demand Gen produzieren. Runway (Gen-4 und Nachfolger) ist die stärkere Wahl, wenn Sie Schnittkontrolle brauchen — Motion Brushes, Kameraführung, Video-zu-Video-Restyling und Frame-genaue Konsistenz über eine Sequenz — was Sie für stärker gestaltete Brand-Spots statt schneller Varianten wollen. Die ehrliche Antwort ist, dass sie komplementär sind: Veo 3 für schnelle, kohärente Base-Clips mit Ton, Runway für die Shots, bei denen Sie Regie-Kontrolle brauchen. Die meisten Teams, die eine echte KI-Creative-Pipeline fahren, nutzen beide statt sich für eines zu entscheiden, und reservieren traditionelle Produktion für das Hero-Asset, das die Kampagne verankert.

Kann ich KI-generierte Videos und Bilder direkt in Google Ads nutzen, oder gibt es Richtlinienbeschränkungen?

Sie können KI-generierte Creatives in Google Ads nutzen, aber drei Richtlinien-Ebenen gelten. Erstens gelten Google Ads' allgemeine Creative-Richtlinien weiterhin — keine irreführenden Aussagen, kein verbotener Content, akkurate Darstellung des Produkts. Zweitens verlangt Google Offenlegung synthetischer Inhalte in bestimmten sensiblen Kategorien (insbesondere Wahlwerbung, wo KI-veränderter Content offengelegt werden muss) und weitet die Kennzeichnung breit aus. Drittens trägt KI-generiertes Medienmaterial oft Provenienz-Metadaten (SynthID-Wasserzeichen auf Veo-Output, C2PA Content Credentials), die Plattformen zunehmend auslesen und Nutzern anzeigen können. Die praktische Regel für Werbetreibende: KI-Creatives sind voll nutzbar für Produkt- und Brand-Advertising, aber Sie müssen sicherstellen, dass das Creative wahrheitsgemäß ist (eine KI-generierte Demo muss zeigen, was das Produkt tatsächlich tut), Sie müssen kategoriespezifische Offenlegungsregeln einhalten und Sie sollten Ihre Provenienz-Metadaten intakt lassen, statt sie zu entfernen. Im Zweifel bei einer sensiblen Kategorie: offenlegen.

Was kostet eine KI-Creative-Pipeline tatsächlich im Betrieb für einen Google-Ads-Account?

Weit weniger als traditionelle Produktion, aber nicht kostenlos, und die Kosten stecken in Credits plus Arbeit statt in Studiozeit. Als grobe 2026-Größenordnungen: Veo-3-Videogenerierung wird pro Sekunde Output über Vertex AI oder pro Generierung in den Gemini/Flow-Consumer-Tiers berechnet, im Bereich von ein paar Cent bis ein paar Euro pro nutzbarem Clip je nach Länge und Auflösung; Runway verkauft Credit-Pakete (ein typisches Standard-/Pro-Abo liegt bei Dutzenden bis niedrigen Hunderten Euro monatlich mit inkludierten Credits); Flux-Bildgenerierung kostet Cent pro Bild über API-Anbieter. Die dominierende Kostenposition ist nicht die reine Generierung — es ist die menschliche Zeit, gute Briefings zu schreiben, die 1-von-5- bis 1-von-10-Generierungen zu kuratieren, die tatsächlich nutzbar sind, und sie zu fertigen Anzeigen zu schneiden. Budgetieren Sie die Kuratierungsarbeit ein. Eine realistische Monatskostenrechnung für einen mittelgroßen Account, der 40-80 Creative-Varianten produziert, sind ein paar Hundert Euro Tool-Credits plus die Zeit eines Creative-Operators, gegenüber Tausenden pro fertigem Video in traditioneller Produktion.

Sind KI-generierte Creatives gut genug, um menschengemachte Anzeigen in Google Ads zu schlagen, oder leidet die Performance?

Es kommt darauf an, was Sie ersetzen und wie Sie es nutzen. Für hochvolumige Variantenproduktion — die vielen Headlines, Hintergründe und kurzen Clips, die Performance Max und Demand Gen konsumieren, um herauszufinden, was funktioniert — erreichen oder schlagen KI-Creatives routinemäßig handgemachte Varianten, weil der Gewinn aus Volumen und Iterationsgeschwindigkeit kommt, nicht aus dem Feinschliff eines einzelnen Assets. Der Algorithmus testet viele KI-Varianten günstig und bringt die Gewinner nach oben. Für das Hero-Brand-Asset, das emotionales Gewicht und Brand-Handwerk trägt, ist KI in 2026 nah dran, aber nicht durchgängig besser als ein starkes menschliches Team, und die Failure Modes (uncanny Gesichter, Physik-Glitches, Textrendering) tauchen weiterhin auf. Das pragmatische Muster: KI für den Long Tail der Varianten, wo Volumen und Geschwindigkeit gewinnen, und menschliches Handwerk für die ein oder zwei Hero-Assets, die Brand-Kampagnen verankern. Die Performance leidet, wenn Teams KI für das Hero nutzen und an der Kuratierung sparen; sie verbessert sich, wenn Teams KI nutzen, um getestete Varianten zu vervielfachen.

Welche exakten Asset-Specs brauche ich für Demand Gen, Performance Max und YouTube?

Die Kern-Specs in 2026: für Bild-Assets über Demand Gen und PMax liefern Sie Landscape 1,91:1 (1200x628), Square 1:1 (1200x1200) und Portrait 4:5 (960x1200) als Minimum, plus Logo-Assets in 1:1 und 4:1. Für Video wollen YouTube und Demand Gen 16:9 horizontal, 1:1 square und 9:16 vertikal, um In-Stream-, In-Feed- und Shorts-Placements abzudecken; zielen Sie auf 1080p Minimum, wobei vertikales 9:16 zunehmend das volumenstärkste Placement ist. Videolänge: 6-Sekunden-Bumper für Reichweite, 15-30 Sekunden für das Haupt-Workhorse und länger für skippable In-Stream, wo die Story es rechtfertigt. Performance Max will die volle Asset-Gruppe gefüllt — mehrere Bilder pro Seitenverhältnis, mehrere Videos pro Orientierung, mehrere Headlines und Descriptions — weil mehr Assets dem Algorithmus mehr Kombinationen zum Testen geben. Das KI-Tooling macht das Füllen all dieser Seitenverhältnisse günstig, was genau der Punkt ist, an dem es sich seinen Platz verdient: die 9:16-, 1:1- und 16:9-Schnitte desselben Konzepts zu generieren, für die traditionelle Produktion das Dreifache berechnen würde.

Wie halte ich Brand-Konsistenz bei der Generierung von Creatives mit KI über viele Varianten hinweg?

Brand-Konsistenz unter KI-Generierung kommt aus drei Kontrollen. Erstens ein straffes, wiederverwendbares Briefing, das Palette (exakte Hex-Werte), Typografie, Ton, Pflichtelemente (Logo-Platzierung, Produktgenauigkeit) und verbotene Elemente spezifiziert — das Briefing ist Ihr Brand-Schutzgeländer, und ein vages Briefing produziert Off-Brand-Output, egal wie gut das Modell ist. Zweitens Reference Conditioning: Flux und Runway akzeptieren beide Referenzbilder, sodass Sie die Generierung auf freigegebenes Brand-Bildmaterial konditionieren, statt sich auf die Defaults des Modells zu verlassen, was Farbe, Stil und Produktähnlichkeit on-brand hält. Drittens ein Kuratierungs-Gate: ein Mensch prüft jede Generierung gegen eine Brand-Checkliste, bevor sie ausgeliefert wird, und lehnt Off-Palette, anatomisch Falsches und Off-Tone ab. Der Fehler, den Teams machen, ist, KI als Verkaufsautomaten zu behandeln — Prompt rein, Anzeige raus. Die Teams, die Brand-Konsistenz halten, behandeln es als steuerbares Produktionstool: konditioniert auf Referenzen, geleitet von einem Briefing und gegated durch menschliche Kuratierung.

Verursachen KI-generierte Gesichter und Personen in Anzeigen rechtliche oder Likeness-Probleme?

Potenziell, und das ist der Bereich, in dem man am vorsichtigsten sein sollte. Drei Risiken: erstens können KI-Modelle versehentlich Output generieren, der einer realen, identifizierbaren Person ähnelt, was Right-of-Publicity- und Likeness-Ansprüche aufwirft — vermeiden Sie das Prompten nach namentlich genannten Personen und prüfen Sie generierte Personen auf unbeabsichtigte Ähnlichkeit. Zweitens ist das Generieren von Personen in Kontexten, die Endorsement implizieren (ein Gesicht, das wie ein Promi aussieht und Ihr Produkt zu nutzen scheint), sowohl ein Likeness- als auch ein False-Endorsement-Risiko. Drittens verschärfen sich Deepfake- und Synthetic-Media-Regulierungen — der EU AI Act und diverse nationale Regeln verlangen Offenlegung synthetischer Inhalte, die reale Personen in bestimmten Kontexten zeigen. Das sichere Muster für Werbetreibende: KI-generierte Personen für generische, klar-synthetische Darstellung nutzen (eine stock-artige Person, die ein Produkt nutzt), Provenienz-Wasserzeichen intakt halten, alles vermeiden, was als spezifische reale Person oder impliziertes Endorsement gelesen werden könnte, und synthetische Inhalte offenlegen, wo die Regulierung es verlangt. Für alles, was eine reale Person zeigt, holen Sie explizite Rechte ein — KI ändert nichts am Likeness-Recht.

Wie passt KI-Creative zur eigenen Asset-Generierung von Performance Max und Demand Gen?

Googles eigene Asset-Generierungs-Features (die KI, die Headlines, Bilder und Videos aus Ihren bestehenden Assets innerhalb von PMax und Demand Gen vorschlägt) und externe Tools wie Veo, Runway und Flux sind komplementär, und das richtige Muster nutzt beide bewusst. Googles In-Platform-Generierung ist bequem und kostenlos, gut, um schnell Lücken in einer Asset-Gruppe zu füllen, aber sie gibt Ihnen weniger Kontrolle über Brand-Spezifika und Konzept und tendiert zu generischem Output. Externe Tools geben Ihnen volle Creative-Kontrolle — Ihr Briefing, Ihre Referenzen, Ihr Konzept — auf Kosten dessen, dass Sie die Produktion selbst machen. Die pragmatische Aufteilung: externe Tools (Veo/Runway/Flux) nutzen, um Ihre durchdachten, on-brand Kern-Assets und das hochvolumige Variantenset zu produzieren, das Sie tatsächlich testen wollen, und Googles In-Platform-Generierung verbleibende Lücken in der Asset-Gruppe füllen lassen, statt die Creative-Last zu tragen. Füttern Sie den Algorithmus mit Ihren besten KI-produzierten Assets plus Ihrem Hero und lassen Sie Googles Generierung den Long Tail absichern. Siehe unseren [Performance Max Asset-Strategie-Guide](/blog/performance-max-asset-groups-creative-strategy) für die Asset-Gruppen-Struktur.