Die jüngste Diskussion um eine angebliche KI-bedingte Störung bei Amazon Web Services (AWS) hat zu einer ungewöhnlich deutlichen Reaktion des Konzerns geführt. Amazon widerspricht einem Bericht der Financial Times energisch und betont, dass die kurzzeitige Unterbrechung im Dezember nicht auf künstliche Intelligenz zurückzuführen war. Stattdessen handelte es sich laut Unternehmen um einen Konfigurationsfehler im Bereich der Zugriffsrechte – ein Problem, das bei jeder Form von Entwicklerwerkzeug auftreten könne.
Begrenzter technischer Vorfall ohne Auswirkungen auf zentrale Dienste
Betroffen war demnach ausschließlich der Cost Explorer, ein Analyse-Tool, das Kunden einen Überblick über ihre Cloud-Kosten gibt. Das Unternehmen spricht von einem „extrem begrenzten“ Vorfall innerhalb nur einer von 39 weltweiten Regionen. Weder Rechenleistung noch Speicher, Datenbanken oder KI-Services seien beeinträchtigt gewesen. Amazon hebt zudem hervor, dass keine Kundenanfragen zu der Störung eingegangen seien, was auf eine sehr geringe praktische Relevanz hindeute. Die Darstellung, es habe einen zweiten Vorfall gegeben, weist der Konzern als „völlig falsch“ zurück.
Amazon unaufhaltsam
Strategische Bedeutung der Klarstellung
Die deutliche Kommunikation erfolgt in einer Phase, in der Hyperscaler massiv in KI-Infrastruktur investieren und zugleich unter Beweis stellen müssen, dass ihre Systeme auch unter wachsender Komplexität stabil bleiben. Vorwürfe, KI könne Fehlfunktionen auslösen, treffen daher einen sensiblen Punkt. Amazons Klarstellung dient nicht nur einer inhaltlichen Richtigstellung, sondern soll offenkundig Vertrauen in die Robustheit der eigenen Systeme stärken. Die Botschaft: Die Zuverlässigkeit der Kerninfrastruktur ist nicht gefährdet und KI-Tools waren nicht der Auslöser des Problems.
Operative Exzellenz als kontinuierlicher Prozess
Zur Einordnung verweist Amazon auf seinen seit mehr als zwei Jahrzehnten etablierten „Correction of Error“-Prozess (COE). Jede Störung – unabhängig davon, ob Kunden betroffen sind – wird systematisch analysiert, um strukturelle Verbesserungen abzuleiten. Konkret wurden im aktuellen Fall zusätzliche Schutzmechanismen eingeführt, unter anderem eine verpflichtende Peer-Review für Produktionszugriffe. Die Maßnahmen erfolgen nicht aufgrund der Schwere des Vorfalls, sondern aus dem Anspruch heraus, die eigene Resilienz stetig zu erhöhen. Für Unternehmenskunden dürfte dies ein zentraler Aspekt sein: Entscheidend ist nicht das vollständige Vermeiden von Fehlern, sondern die Qualität und Geschwindigkeit der organisatorischen Reaktion.


