Alibaba baut seine Position im Bereich generativer KI weiter aus und bringt mit Wan2.7-Video ein leistungsstarkes Modell zur Videoproduktion auf den Markt. Die neue Lösung soll es Creatorn ermöglichen, komplette Videoproduktionen mit Regiequalität zu erstellen – gesteuert allein durch natürliche Sprache.
KI entwickelt sich zur kreativen Produktionsplattform
Mit Wan2.7-Video geht Alibaba über klassische KI-Tools hinaus, die bisher vor allem einzelne Assets generieren. Stattdessen deckt das System erstmals den gesamten Produktionsprozess ab – von der Ideenentwicklung über die Erstellung bis hin zur Nachbearbeitung fertiger Inhalte.
Gewinnen in der Plattform-Ökonomie
Vier Modelle für den kompletten Workflow
Die Plattform umfasst mehrere spezialisierte Modelle, darunter Text-zu-Video, Bild-zu-Video, Referenz-basierte Generierung sowie umfassende Bearbeitungsfunktionen. Damit lassen sich unterschiedliche Eingabeformate – Text, Bild, Video und Audio – in einem einheitlichen System kombinieren.
Die Anwendung deckt dabei sämtliche Schritte ab: Generierung, Bearbeitung, Anpassung, Fortführung und Referenzierung von Inhalten. Ziel ist eine konsistente Storyline auch über mehrere Szenen hinweg.
Hohe Flexibilität bei Qualität und Länge
Wan2.7-Video ermöglicht laut Alibaba die Erstellung von Clips mit einer Länge von zwei bis 15 Sekunden in 720p- und 1080p-Auflösung. Über API-Schnittstellen lassen sich zudem skalierbare Workflows für Unternehmen umsetzen, etwa für Serienproduktionen oder Marketingkampagnen.
Präzise Steuerung per Sprache
Ein zentrales Merkmal ist die Steuerung über natürliche Sprache. Nutzer können nahezu alle Aspekte eines Videos anpassen – von Charakteren und Dialogen über Szenen und Stil bis hin zu Kameraführung und Lichtstimmung.
Auch komplexe Änderungen wie Dialoganpassungen inklusive synchronisierter Lippenbewegungen oder die Anpassung von Wettereffekten über Audioeingaben sind möglich. Gleichzeitig bleibt die visuelle und akustische Konsistenz über mehrere Szenen hinweg erhalten.
Konsistenz und Detailtiefe auf neuem Niveau
Das System unterstützt die gleichzeitige Steuerung mehrerer Charaktere mit individuellen Stimmen und visuellen Merkmalen. Zudem stehen zahlreiche Stilvarianten und emotionale Ausdrucksmöglichkeiten zur Verfügung, um realistische und differenzierte Inhalte zu erzeugen.
Automatisierte Storyboards und filmische Effekte
Ein einzelner Prompt kann ein vollständiges Storyboard erzeugen, inklusive komplexer Kamerabewegungen und dramaturgischer Übergänge. Dazu zählen etwa Drohnenflüge in First-Person-Perspektive oder 360-Grad-Aufnahmen.
Die integrierte Story-Engine sorgt für eine kohärente Narration und ermöglicht fließende Übergänge zwischen Szenen.
Ergänzung durch neues Bildmodell
Parallel zur Videolösung hat Alibaba auch das Bildmodell Wan2.7-Image vorgestellt. Dieses soll insbesondere bei Personalisierung, Farbgenauigkeit und Textdarstellung neue Maßstäbe setzen. Funktionen wie präzise Farbsteuerung oder die Generierung komplexer Textelemente erweitern die Einsatzmöglichkeiten im Design- und Marketingbereich.
Schritt in Richtung KI-gestützte Medienproduktion
Beide Modelle sind über Alibaba Cloud und weitere Plattformen verfügbar und werden in bestehende Anwendungen integriert. Damit verfolgt das Unternehmen das Ziel, eine durchgängige Infrastruktur für KI-gestützte Content-Produktion bereitzustellen.
Mit Wan2.7-Video positioniert sich Alibaba als zentraler Anbieter für multimodale KI-Lösungen. Die Entwicklung zeigt, wie sich generative KI zunehmend von einem Werkzeug zur Unterstützung hin zu einer eigenständigen kreativen Produktionsplattform entwickelt.


