Alibaba treibt die Entwicklung agentischer KI voran und öffnet mit Qwen3.5 eine neue Modellgeneration, die auf hohe Effizienz und breite Einsatzfähigkeit ausgelegt ist. Zum Start wurde Qwen3.5-397B-A17B, auch Qwen3.5-Plus genannt, als Open Source veröffentlicht. Das Modell kombiniert multimodale Fähigkeiten mit einer Architektur, die speziell auf niedrige Inferenzkosten optimiert wurde – ein entscheidender Faktor für den praktischen Einsatz von KI-Systemen.
Fortschritte in Multimodalität und Sprachvielfalt
Qwen3.5 ist nativ multimodal und verarbeitet Text, Bilder und Videos. Trainiert wurde die Serie laut Alibaba auf Billionen von Vision-Language-Tokens aus multilingualen Texten, visuellen Daten, STEM-Inhalten und komplexen Reasoning-Szenarien. Die Modellreihe unterstützt 201 Sprachen und Dialekte, darunter zahlreiche bislang wenig repräsentierte Sprachräume wie Hawaiianisch, Fidschianisch oder Niger-Kongo-Sprachen.
In Benchmarks zeigt Qwen3.5-397B-A17B starke Leistungen in Sprachverständnis, Problemlösung, Codegenerierung, Agent-Funktionen und multimodaler Analyse und erreicht damit ein Niveau, das mit führenden Frontier-Modellen konkurriert.
Gewinnen in der Plattform-Ökonomie
Effiziente Architektur für den Produktiveinsatz
Ein zentrales Ziel von Alibaba war die Senkung der Betriebskosten. Qwen3.5 kombiniert lineare Attention mit einem sparsamen Mixture-of-Experts-Design. Dadurch erzielt Qwen3.5-397B-A17B deutlich geringere Inferenzkosten, ohne Abstriche bei der Leistungsfähigkeit im Vergleich zum deutlich größeren Qwen3-Max, der über eine Billion Parameter umfasst.
Das Modell ist auf reale Agentensysteme ausgelegt und soll Aufgaben ausführen können, die über reine Analysefunktionen hinausgehen: Qwen3.5 kann als visueller Agent auf Smartphones und Computern agieren, wissenschaftliche visuelle Aufgaben lösen, zweistündige Videos verstehen und UI-Skizzen in funktionalen Frontend-Code übersetzen.
Industrieller Einsatz und geöffnete Zugangswege
Die Veröffentlichung markiert einen breiteren Trend in der Open-Source-KI: Neben Spitzenleistung rücken nun Produktionsfaktoren wie Latenz, Durchsatz und Gesamtbetriebskosten stärker in den Fokus. Diese Ausrichtung spiegelt sich auch in Partnerschaften wider, etwa beim IOC, das zu den Olympischen Winterspielen Milano Cortina 2026 ein erstes LLM-gestütztes System auf Basis von Qwen einführt, um Fan-Erlebnisse und interne Abläufe zu verbessern.


