ANZEIGE

ANZEIGE

Lesezeit ca. 2 Minuten

Alibaba will mit Qwen3 neue Maßstäbe für Open-Source-KI setzen

KI-Wettbewerb: Mit Qwen3 führt Alibaba Hybrid-Reasoning-Modelle ein, die komplexe Aufgaben effizient bewältigen. Die Serie soll durch starke Multilingualität, Agentenfähigkeiten und Spitzenplätze in internationalen Benchmarks überzeugen.

Lesezeit ca. 2 Minuten
Logos auf dem Campus der Alibaba Group
Foto: Alibaba Group
Artikel teilen
Thema
ANZEIGE

Alibaba hat die neueste Generation seiner offenen Large-Language-Model-Familie vorgestellt: Qwen3. Die Serie umfasst sechs dichte Modelle und zwei Mixture-of-Experts-Modelle (MoE) und markiert Alibabas Einstieg in die Hybrid-Reasoning-Technologie.

Hybrid-Reasoning: Flexibilität für komplexe Aufgaben

Die Qwen3-Modelle kombinieren klassische LLM-Fähigkeiten mit dynamischem, hybriden Denken. Sie wechseln nahtlos zwischen einem „Thinking Mode“ für komplexe Aufgaben wie Mathematik, Programmieren und logisches Schlussfolgern und einem „Non-Thinking Mode“ für schnelle Standardantworten. Entwickler können beim API-Zugriff die Denkzeit fein justieren, mit einer Verarbeitung von bis zu 38.000 Token. Besonders das Modell Qwen3-235B-A22B senkt dabei die Betriebskosten erheblich und unterstützt eine breitere Nutzung von Hochleistungs-KI.

Anzeige

Kurzfristig Experten benötigt? Hier die passenden Freelancer auf Fiverr

Verbesserungen bei Multilingualität, Agenten und menschlicher Interaktion

Im Vergleich zum Vorgänger Qwen2.5 basiert Qwen3 auf einer doppelt so großen Trainingsbasis von 36 Billionen Token. Dadurch verbessert sich die Leistung deutlich in den Bereichen Multilingualität, Agenten-Integration, logisches Denken und menschliche Interaktion.

Zu den Neuerungen zählen:

  • Unterstützung von 119 Sprachen und Dialekten mit Spitzenleistungen in Übersetzungen und Anweisungsfolgen
  • Native Unterstützung des Model Context Protocols (MCP) für komplexe Agentenaufgaben
  • Überlegene Ergebnisse in Mathematik, Programmieren und logischer Deduktion
  • Natürlichere, kreativere Dialoge durch verbesserte menschliche Ausrichtung

Top-Platzierungen in Benchmarks

Dank neuer Modellarchitektur, umfangreicherem Datensatz und optimierter Trainingsmethodik erreicht Qwen3 Spitzenwerte in Benchmarks wie AIME25 (mathematisches Denken), LiveCodeBench (Programmierfähigkeiten), BFCL (Werkzeugnutzung) und Arena-Hard (Anleitungstreue). Ein vierstufiger Trainingsprozess, darunter Chain-of-Thought-Training und reasoning-basiertes Reinforcement Learning, ermöglichte diese Fortschritte.

Freier Zugang zur Förderung von Innovation

Die Qwen3-Modelle sind kostenlos auf Plattformen wie Hugging Face, GitHub und ModelScope verfügbar. Eine API-Anbindung folgt bald über das Model Studio von Alibaba. Zusätzlich treibt Qwen3 Alibabas KI-Assistenten Quark an.

Seit ihrem Start wurden Qwen-Modelle weltweit über 300 Millionen Mal heruntergeladen. Über 100.000 abgeleitete Modelle auf Hugging Face belegen den breiten Erfolg der offenen Qwen-Serie.

Thema interessant? Hier gibt es ähnliche Artikel:
Noch mehr Beiträge zu China, Cloud Computing, Künstliche Intelligenz

ANZEIGE