Googles KI-Sparte DeepMind hat mit Nano Banana Pro eine neue Generation seines Bildgenerierungsmodells vorgestellt. Es basiert auf Gemini 3 Pro und erweitert die Möglichkeiten zur visuellen Gestaltung erheblich – von der Erstellung komplexer Infografiken bis hin zur präzisen Bearbeitung einzelner Bildelemente.
Stärkere KI, bessere Bilder
Im Vergleich zur Vorgängerversion Nano Banana erlaubt das neue Modell deutlich präzisere Visualisierungen. Möglich wird das durch die Integration von fortschrittlichem Weltwissen und kontextbasierter Bilderzeugung. Nutzer können etwa auf Basis aktueller Informationen aus der Google-Suche Infografiken, Rezepte oder Wettergrafiken generieren. Dank der verbesserten Texterkennung lassen sich auch mehrsprachige Inhalte direkt im Bild korrekt darstellen.
Gewinnen in der Plattform-Ökonomie
Kontrolle über Text, Stil und Lokalisierung
Ein besonderer Fortschritt liegt in der Darstellung von Text innerhalb der Bilder. Nano Banana Pro bietet hohe Lesbarkeit in mehreren Sprachen und unterstützt unterschiedliche Typografien, Texturen und Stile. Dadurch eignet sich das Modell sowohl für Marketingkampagnen als auch für die Lokalisierung internationaler Inhalte.
Konsistente Szenen mit mehreren Figuren
Ein weiterer Schwerpunkt liegt laut Google auf der Konsistenz: Bis zu 14 Bildelemente lassen sich zu einer Szene kombinieren – mit Wiedererkennbarkeit für bis zu fünf Personen. So entstehen etwa fotorealistische Modestrecken, komplexe Storyboards oder Lifestyle-Szenen mit hoher Detailtreue. Auch Skizzen oder Blaupausen lassen sich in fertige Visualisierungen überführen.
Studioqualität mit Kontrolle bis ins Detail
Nano Banana Pro ermöglicht eine detaillierte Bildbearbeitung auf Studio-Niveau. Nutzer können Kameraeinstellungen ändern, Fokus und Tiefenschärfe justieren oder die Lichtstimmung gezielt anpassen – etwa durch Tag-Nacht-Wechsel oder gezielte Hervorhebungen einzelner Bildbereiche. Die fertigen Bilder lassen sich in bis zu 4K-Auflösung und verschiedenen Seitenverhältnissen exportieren, passend für Social Media, Print oder Film.
Verfügbarkeit für verschiedene Zielgruppen
Nano Banana Pro wird global ausgerollt – je nach Zielgruppe in unterschiedlichen Produkten:
- Privatnutzer und Studierende: im Gemini-App-Modus „Thinking“, mit gestaffelten Nutzungskontingenten je nach Abo.
- Werbetreibende: in Google Ads, zur Erstellung visuell hochwertiger Kampagnen.
- Unternehmen und Entwickler: über Gemini API, Google Antigravity oder Vertex AI.
- Kreativschaffende: im Filmemacher-Tool Google Flow für präzise Szenenkompositionen.
Nachvollziehbare KI-Bilder durch Wasserzeichen
Zur Erkennbarkeit KI-generierter Bilder integriert Google weiterhin SynthID, ein unsichtbares digitales Wasserzeichen. Ergänzt wird dies – je nach Abo – durch ein sichtbares Wasserzeichen (bei Gratis- und Pro-Nutzern), das bei Ultra-Abonnenten und professionellen Anwendungen entfällt. In der Gemini-App lassen sich Bilder zudem rückwirkend auf ihre Herkunft überprüfen.


