Hochwertige Datensätze sind essenziell für die Entwicklung leistungsstarker KI-Modelle. Im Jahr 2024 haben mehrere prominente Datenlizenzabkommen zwischen Technologieunternehmen und Datenanbietern gezeigt, wie wichtig erstklassige Daten für den Fortschritt der KI sind.
Die folgenden zehn Partnerschaften haben laut Similiarweb besonders dazu beigetragen, KI-Anwendungen durch den Zugang zu einzigartigen Datensätzen zu verbessern:
1. OpenAI erwirbt Rockset
Im Juni 2024 erwarb OpenAI das Dateninfrastrukturunternehmen Rockset. Ziel der Übernahme, die durch eine Aktienvereinbarung im Wert von mehreren Hundert Millionen Dollar erfolgte, war die Verbesserung von OpenAIs Datenabruf und Verarbeitung in Echtzeit.
2. Reddit und OpenAI
Reddit lizenziert seit Mai 2024 seine Inhalte an OpenAI. Das Abkommen ermöglicht OpenAI, Redits Community-Inhalte für Produkte wie ChatGPT zu nutzen. Laut Reddits S-1-Unterlagen beträgt der Wert solcher Vereinbarungen 203 Millionen US-Dollar, davon 66,4 Millionen US-Dollar für 2024.
3. Shutterstock und Apple
Apple investierte zwischen 25 und 50 Millionen US-Dollar in eine Partnerschaft mit Shutterstock, um Bildmaterial für KI-Modelle zu lizensieren. Diese Kooperation unterstreicht den Bedarf an hochwertigen visuellen Daten.
4. Google und Stack Overflow
Im Februar 2024 schloss Google eine Vereinbarung mit Stack Overflow, um Inhalte der Entwickler-Community für die Optimierung seines Gemini-Chatbots zu verwenden. Details zu den finanziellen Konditionen wurden nicht veröffentlicht.
5. News Corp und OpenAI
Ein Fünfjahresvertrag zwischen News Corp und OpenAI erlaubt OpenAI den Zugang zu journalistischen Inhalten, darunter das Archiv des Wall Street Journals. Die Vereinbarung hat einen Wert von über 250 Millionen US-Dollar.
6. Meta und Reuters
Reuters und Meta unterzeichneten im Oktober 2024 eine mehrjährige Lizenzvereinbarung, die Metas KI mit Nachrichteninhalten versorgt. Auch hier wurden keine finanziellen Details bekannt gegeben.
7. The Atlantic und OpenAI
OpenAI lizenziert Inhalte von The Atlantic, um die Qualität seiner KI-Modelle zu verbessern. Obwohl finanzielle Informationen fehlen, verdeutlicht die Partnerschaft den Wert diverser Textdaten.
8. Google und Reddit
Zusätzlich zu OpenAI hat Google Reddit-Daten lizenziert. Die jährlichen Kosten belaufen sich auf etwa 60 Millionen US-Dollar.
9. OpenAI und Financial Times
Die Financial Times schloss im April 2024 eine Lizenzvereinbarung mit OpenAI. Die Inhalte sollen für die Entwicklung von KI-Tools genutzt werden.
10. Dotdash Meredith und OpenAI
OpenAI integrierte im Mai 2024 Inhalte von Dotdash Meredith, dem Verlag hinter „People“ und „Better Homes & Gardens“, in seine KI-Modelle.
Fazit: Ohne Datenabkommen geht nichts mehr
Die Abkommen verdeutlichen den steigenden Bedarf an hochspezialisierten Daten, um KI-Modelle präziser und effizienter zu machen. Anbieter wie Similarweb spielen hierbei eine zentrale Rolle, indem sie umfassende digitale Daten und Marktanalysen bereitstellen.