Alibaba hat mit ZEROSEARCH eine neue Trainingsmethode für große Sprachmodelle (LLMs) vorgestellt, die die Kosten für das Erlernen von Suchaufgaben drastisch senkt. Durch eine zweistufige Simulationsstrategie ersetzt das Verfahren kostenintensive API-Zugriffe auf kommerzielle Suchmaschinen – eine Innovation, die laut Unternehmen zu Einsparungen von bis zu 90 Prozent führt.
Suchsimulation statt API-Zugriff
Traditionell erforderte die Schulung von LLMs für Suchanfragen umfangreiche Interaktionen mit externen Suchdiensten. Diese verursachten nicht nur hohe Kosten, sondern lieferten auch teils unzuverlässige Daten, was die Modellqualität beeinträchtigen konnte. Alibaba adressiert dieses Problem mit einem zweistufigen Ansatz: In einem ersten Schritt wird das Modell mithilfe von Supervised Fine-Tuning zu einer Art Suchmodul trainiert, das relevante Dokumente auf Anfragen hin simuliert. In der anschließenden RL-Phase wird durch gezielte Verschlechterung der Dokumentqualität ein Lernanreiz geschaffen, der das Modell zur kontinuierlichen Verbesserung zwingt.
Leistungsstark trotz Kostenreduktion
Interne Tests zeigen, dass mit ZEROSEARCH trainierte Modelle ähnlich gut oder sogar besser abschneiden als solche, die mit echten Suchanfragen über APIs trainiert wurden. Ein Retrieval-Modul auf Basis des Qwen2.5-7B-Modells erreichte eine Leistung auf dem Niveau von Google Search. Ein größeres Modell (14B) konnte diese sogar übertreffen – bei einem Bruchteil der Kosten.
Qwen3-Modell: Preis-Leistungs-Sieger im Test
Im Rahmen einer unabhängigen Analyse durch das Evaluierungsinstitut Artificial Analysis erreichte das Modell Qwen3-235B-A22B den fünften Platz in der Gesamtwertung (Intelligenz, Mathematik, Codierung, Wissenschaft). In der Kategorie Preis-Leistung belegte es sogar den ersten Platz – ein Hinweis auf die hohe Effizienz des neuen Trainingsverfahrens.
Open-Source-Offensive zur Demokratisierung von KI
ZEROSEARCH ist Teil von Alibabas übergeordnetem Ziel, KI-Entwicklung kostengünstiger und zugänglicher zu machen. Das Unternehmen hat in den letzten Monaten eine Reihe von Open-Source-Modellen veröffentlicht, die Entwicklern weltweit erlauben, eigene KI-Lösungen unabhängig und budgetfreundlich umzusetzen.