Alibaba hat mit Qwen3 die dritte Generation seiner Open-Source-Sprachmodelle vorgestellt. Die Serie umfasst acht neue Modelle, darunter sechs dichte Varianten mit bis zu 32 Milliarden Parametern und zwei MoE-Modelle (Mixture of Experts) mit 30 Milliarden beziehungsweise 235 Milliarden Parametern. Letzteres ist in der Lage, mit nur 22 Milliarden aktiven Parametern zu arbeiten – ein Ansatz, der Rechenkosten reduziert und gleichzeitig hohe Leistung ermöglicht.
Spitzenplatz bei LiveBench durch verbesserte Instruktionsverarbeitung
Das Modell Qwen3-235B-A22B erreicht laut dem unabhängigen Benchmark LiveBench Platz 1 unter allen Open-Source-Sprachmodellen und erzielt dabei die höchste Bewertung in der Kategorie „Instruction Following“. Damit rangiert es auf dem siebten Platz im Gesamtvergleich mit allen getesteten KI-Modellen.
Kurzfristig Experten benötigt? Hier die passenden Freelancer auf Fiverr
Hybrides Denken: Kombination aus Rechenleistung und Effizienz
Erstmals setzt Alibaba bei Qwen3 auf ein hybrides Reasoning-Modell. Dieses erlaubt es, flexibel zwischen einem „denkenden Modus“ für komplexe Aufgaben wie mathematische Probleme oder Programmierung und einem „nicht denkenden Modus“ für schnellere Standardanfragen zu wechseln. Besonders in der API-Nutzung ermöglicht dies eine feinjustierbare Steuerung von Rechenzeit und Antwortqualität – mit bis zu 38.000 Tokens pro Abfrage.
Fortschritte in Multilingualität und agentenbasierter Interaktion
Die neuen Modelle wurden auf einer Datenmenge von 36 Billionen Tokens trainiert, doppelt so viel wie bei der Vorgängerversion Qwen2.5. Entsprechend zeigen sie überdurchschnittliche Leistungen in verschiedenen Bereichen:
- Multilinguale Fähigkeiten: Unterstützung von 119 Sprachen und Dialekten bei hoher Übersetzungsgenauigkeit.
- Agentenintegration: Native Unterstützung des Model Context Protocols (MCP) und verbesserte Funktionsaufrufe.
- Menschliche Interaktion: Natürlichere Konversationen und besseres Rollenspielverhalten.
- Werkzeugnutzung: Starke Leistungen in Benchmarks wie LiveCodeBench und BFCL.
Open Source als Innovationsmotor
Alle Qwen3-Modelle stehen ab sofort auf Plattformen wie Hugging Face, GitHub und ModelScope frei zur Verfügung. In Kürze wird zudem eine API über Alibabas Model Studio verfügbar sein. Zusätzlich kommen die Modelle in Alibabas KI-gestütztem Superassistenten Quark zum Einsatz.
Seit Einführung der Qwen-Serie wurden weltweit über 300 Millionen Downloads verzeichnet. Zudem entstanden über 100.000 abgeleitete Modelle auf Hugging Face – ein klares Zeichen für die Bedeutung von Qwen als globaler Standard im Open-Source-Bereich für KI-Entwicklung.