ANZEIGE

ANZEIGE

Googles Gemini hebt Bildbearbeitung mit DeepMind-Modell auf neues Level

Google Image-Generierung mit KI
Foto: Google

Key takeaways

Google integriert ein leistungsstarkes neues Bildbearbeitungsmodell in die Gemini-App. Es ermöglicht realistische Änderungen an Fotos, ohne die Ähnlichkeit von Personen oder Tieren zu verlieren. Nutzer können Szenen verändern, Objekte kombinieren und Stile übertragen – alles mit sichtbaren und unsichtbaren Wasserzeichen zur Kennzeichnung als KI-generiert.

Lesezeit ca. 2 Minuten

In der Gemini-App von Google hält ab sofort ein erweitertes Bildbearbeitungsmodell Einzug, das neue Maßstäbe in der KI-gestützten Fotobearbeitung setzen soll. Wie der Konzern mitteilt, ist das Modell laut interner Bewertungen derzeit die bestbewertete Lösung weltweit. Bereits in der Testphase stieß es auf breite Begeisterung – jetzt ist es vollständig in die Gemini-App integriert und für alle Nutzer verfügbar.

Natürlicher Look bleibt erhalten

Ein Hauptaugenmerk der Weiterentwicklung liegt auf der konsistenten Darstellung von Gesichtern, Tieren und anderen erkennbaren Motiven. Gerade bei der Bearbeitung persönlicher Bilder zählt jedes Detail – selbst kleinste Abweichungen können stören. Das neue System sorgt dafür, dass die visuelle Identität einer Person über verschiedene Bearbeitungsschritte hinweg erhalten bleibt. Ob ein Retro-Look, ein neues Outfit oder ein virtueller Ortswechsel: Die Charakterzüge des Motivs bleiben konsistent erkennbar.

Nutzer müssen dafür lediglich ein Foto hochladen und per Texteingabe beschreiben, was verändert werden soll. Die Anwendung kann Hintergrundbilder austauschen, mehrere Fotos miteinander verschmelzen oder einen Raum visuell neu einrichten – etwa durch virtuelle Möbelstücke oder andere Elemente.

Anzeige

Gewinnen in der Plattform-Ökonomie

von Alexander Graf – der Leitfaden für Handelsentscheider
★★★★☆ 4,4 / 5 Sterne
Jetzt bei Amazon entdecken

Vielfältige Möglichkeiten durch KI

Das Update bietet weitreichende neue Funktionen: So lassen sich beispielsweise verschiedene Outfits oder Berufe digital anprobieren, Zeitreisen in vergangene Jahrzehnte simulieren oder Tiere fantasievoll ins Bild setzen. Neu ist auch die Möglichkeit, mehrere Fotos zu kombinieren, etwa für Porträts mit Haustieren in ungewöhnlichen Szenen – wie gemeinsam auf dem Basketballfeld.

Ein weiteres Highlight ist das sogenannte Multi-Turn-Editing. Damit lassen sich Bilder schrittweise und gezielt verändern, ohne bereits bearbeitete Bereiche zu beeinflussen. So kann ein leerer Raum zunächst gestrichen, anschließend möbliert und weiter angepasst werden. Auch Stilmixe sind möglich: Nutzer können Muster oder Farben aus einem Bild extrahieren und auf Objekte in einem anderen Bild übertragen – etwa die Struktur von Blütenblättern auf ein Kleid.

Wasserzeichen für Transparenz

Alle in der Gemini-App erstellten oder bearbeiteten Bilder werden automatisch mit einem sichtbaren Wasserzeichen sowie der unsichtbaren Kennzeichnung SynthID versehen. So soll sichergestellt werden, dass die Herkunft der Bilder als KI-generiert jederzeit nachvollziehbar bleibt.

Mit dem neuen Bearbeitungsmodell rückt Google einen Schritt näher an das Ziel, generative KI nicht nur leistungsfähiger, sondern auch zugänglicher und verlässlicher zu machen – insbesondere in Anwendungen, die kreatives Arbeiten mit persönlicher Authentizität verbinden.

Ähnliche Artikel

Must-read

ANZEIGE
JANGER E-Commerce
Wer als Shop-Betreiber, E-Commerce Manager oder Gründer einer E-Commerce-Marke erfolgreich werden möchte, muss drei grundsätzliche Faktoren, Verkaufspsychologie, Außendarstellung und Design sowie Nutzererlebnis, verinnerlichen.

Top-News

Sponsored

Sponsored