ANZEIGE

ANZEIGE

OpenAI stellt GPT-5.4 vor: Neues Spitzenmodell mit native Computer-Steuerung

ChatGPT App auf einem Smartphone
Foto: Primakov / depositphotos.com

Key takeaways

GPT-5.4 vereint erstmals erstklassiges Reasoning, native Computersteuerung und starke Codex-Fähigkeiten in einem Modell für professionelle Workflows. Es liefert höhere Genauigkeit, effizientere Tool-Nutzung und bessere Dokument-Ergebnisse.

Lesezeit ca. 2 Minuten

Nur wenige Tage nach Start von ChatGPT 5.3 Instant für eher „alltäglichere“ Anwendungsfälle, markiert der Start von GPT-5.4 den wohl bisher größten Sprung innerhalb der GPT-5-Generation. Das neue Modell vereint laut OpenAI gesteigerte Reasoning-Fähigkeiten, hochentwickelte Codex-Kompetenzen und erstmals native Computersteuerung in einem System, das für reale professionelle Workflows optimiert wurde. In ChatGPT, der API und Codex steht GPT-5.4 ab sofort als Standard-Frontier-Modell bereit, während GPT-5.4 Pro zusätzliche Leistung für besonders komplexe Aufgaben bietet.

Deutlich verbesserte Leistungswerte in Benchmarks

Gegenüber GPT-5.2 erreicht das neue Modell massive Fortschritte: Auf GDPval steigt die Erfolgsquote auf 83 % und übertrifft damit professionelle Benchmarks in zahlreichen Branchen. Auch bei SWE-Bench Pro und OSWorld erzielt GPT-5.4 neue Bestwerte, insbesondere bei Computer-Use-Aufgaben, wo es erstmals menschliche Leistung übertrifft. Gleichzeitig benötigt der Ansatz weniger Tokens und arbeitet schneller, was Entwickler- und Business-Workflows messbar beschleunigt.

Anzeige

Gewinnen in der Plattform-Ökonomie

von Alexander Graf – der Leitfaden für Handelsentscheider
★★★★☆ 4,4 / 5 Sterne
Jetzt bei Amazon entdecken

Stärker in Dokumenten, Präsentationen und Tabellen

OpenAI hat GPT-5.4 gezielt für Office-ähnliche Tätigkeiten geschärft. Spreadsheet-Aufgaben, wie sie Investment-Banking-Analysten typischerweise erledigen, löst das Modell nun mit durchschnittlich 87 % statt 68 %. Auch Präsentationen und komplexe Dokumente wirken strukturierter, ästhetischer und konsistenter. Fehlerquoten sinken deutlich, weil GPT-5.4 33 % weniger falsche Einzelaussagen erzeugt.

Native Computersteuerung & verbesserte visuelle Wahrnehmung

Erstmals kann ein GPT-Basismodell ohne Zusatzmodule Computerumgebungen bedienen: Maus- und Tastaturaktionen, Webseiten-Navigation oder Desktop-Interaktionen erfolgen nativ und präziser als bei Vorgängern. Die visuelle Erkennung wurde durch höhere Pixel-Toleranzen und detailreichere Bildverarbeitung verbessert, was zu klareren Klick-Entscheidungen, besserer Dokumentenanalyse und effizienterem Agent-Verhalten führt.

Fortschritte im Tool-Einsatz und bei Web-Recherche

Neu ist außerdem ein Tool-Search-Mechanismus, der es GPT-5.4 ermöglicht, große Tool-Ökosysteme effizient zu durchsuchen, statt sämtliche Definitionen permanent im Kontext zu halten. Das spart nahezu die Hälfte der Tokens und beschleunigt die Ausführung. Auch die Web-Suche arbeitet persistenter und präziser: In BrowseComp steigt die Erfolgsrate auf 82,7 % bzw. 89,3 % in der Pro-Variante.

Höhere Steuerbarkeit & transparente Reasoning-Pfade

Unter dem Namen GPT-5.4 Thinking führt das Modell nun einen planbaren Vorab-Gedankenpfad ein, den Nutzer während der Antwort anpassen können. Das verbessert die Kontrolle bei komplexen Workflows und reduziert unnötige Rückfragen. Gleichzeitig zeigen interne Sicherheitsanalysen, dass GPT-5.4 sein Chain-of-Thought kaum absichtlich verschleiern kann – ein positives Sicherheitsmerkmal.

Verfügbarkeit und Preise

GPT-5.4 und GPT-5.4 Pro werden schrittweise in ChatGPT, der API und Codex ausgerollt. GPT-5.2 Thinking bleibt noch drei Monate als Legacy-Option verfügbar. In der API reflektiert ein höherer Tokenpreis die gesteigerte Leistung, während verbesserte Token-Effizienz die Gesamtkosten vieler Aufgaben senkt. Zudem ermöglicht Codex experimentell Kontextfenster bis zu 1 Million Tokens.

Ähnliche Artikel

Must-read

ANZEIGE
JANGER E-Commerce
Wer als Shop-Betreiber, E-Commerce Manager oder Gründer einer E-Commerce-Marke erfolgreich werden möchte, muss drei grundsätzliche Faktoren, Verkaufspsychologie, Außendarstellung und Design sowie Nutzererlebnis, verinnerlichen.

Top-News

Sponsored

Sponsored