Nur wenige Tage nach Start von ChatGPT 5.3 Instant für eher „alltäglichere“ Anwendungsfälle, markiert der Start von GPT-5.4 den wohl bisher größten Sprung innerhalb der GPT-5-Generation. Das neue Modell vereint laut OpenAI gesteigerte Reasoning-Fähigkeiten, hochentwickelte Codex-Kompetenzen und erstmals native Computersteuerung in einem System, das für reale professionelle Workflows optimiert wurde. In ChatGPT, der API und Codex steht GPT-5.4 ab sofort als Standard-Frontier-Modell bereit, während GPT-5.4 Pro zusätzliche Leistung für besonders komplexe Aufgaben bietet.
Deutlich verbesserte Leistungswerte in Benchmarks
Gegenüber GPT-5.2 erreicht das neue Modell massive Fortschritte: Auf GDPval steigt die Erfolgsquote auf 83 % und übertrifft damit professionelle Benchmarks in zahlreichen Branchen. Auch bei SWE-Bench Pro und OSWorld erzielt GPT-5.4 neue Bestwerte, insbesondere bei Computer-Use-Aufgaben, wo es erstmals menschliche Leistung übertrifft. Gleichzeitig benötigt der Ansatz weniger Tokens und arbeitet schneller, was Entwickler- und Business-Workflows messbar beschleunigt.
Gewinnen in der Plattform-Ökonomie
Stärker in Dokumenten, Präsentationen und Tabellen
OpenAI hat GPT-5.4 gezielt für Office-ähnliche Tätigkeiten geschärft. Spreadsheet-Aufgaben, wie sie Investment-Banking-Analysten typischerweise erledigen, löst das Modell nun mit durchschnittlich 87 % statt 68 %. Auch Präsentationen und komplexe Dokumente wirken strukturierter, ästhetischer und konsistenter. Fehlerquoten sinken deutlich, weil GPT-5.4 33 % weniger falsche Einzelaussagen erzeugt.
Native Computersteuerung & verbesserte visuelle Wahrnehmung
Erstmals kann ein GPT-Basismodell ohne Zusatzmodule Computerumgebungen bedienen: Maus- und Tastaturaktionen, Webseiten-Navigation oder Desktop-Interaktionen erfolgen nativ und präziser als bei Vorgängern. Die visuelle Erkennung wurde durch höhere Pixel-Toleranzen und detailreichere Bildverarbeitung verbessert, was zu klareren Klick-Entscheidungen, besserer Dokumentenanalyse und effizienterem Agent-Verhalten führt.
Fortschritte im Tool-Einsatz und bei Web-Recherche
Neu ist außerdem ein Tool-Search-Mechanismus, der es GPT-5.4 ermöglicht, große Tool-Ökosysteme effizient zu durchsuchen, statt sämtliche Definitionen permanent im Kontext zu halten. Das spart nahezu die Hälfte der Tokens und beschleunigt die Ausführung. Auch die Web-Suche arbeitet persistenter und präziser: In BrowseComp steigt die Erfolgsrate auf 82,7 % bzw. 89,3 % in der Pro-Variante.
Höhere Steuerbarkeit & transparente Reasoning-Pfade
Unter dem Namen GPT-5.4 Thinking führt das Modell nun einen planbaren Vorab-Gedankenpfad ein, den Nutzer während der Antwort anpassen können. Das verbessert die Kontrolle bei komplexen Workflows und reduziert unnötige Rückfragen. Gleichzeitig zeigen interne Sicherheitsanalysen, dass GPT-5.4 sein Chain-of-Thought kaum absichtlich verschleiern kann – ein positives Sicherheitsmerkmal.
Verfügbarkeit und Preise
GPT-5.4 und GPT-5.4 Pro werden schrittweise in ChatGPT, der API und Codex ausgerollt. GPT-5.2 Thinking bleibt noch drei Monate als Legacy-Option verfügbar. In der API reflektiert ein höherer Tokenpreis die gesteigerte Leistung, während verbesserte Token-Effizienz die Gesamtkosten vieler Aufgaben senkt. Zudem ermöglicht Codex experimentell Kontextfenster bis zu 1 Million Tokens.


