Der neue ChatGPT-Agent von OpenAI markiert einen Wendepunkt in der Nutzung künstlicher Intelligenz für komplexe Arbeitsabläufe. Ausgestattet mit einem virtuellen Computer, kann der Agent eigenständig Webseiten bedienen, Daten analysieren, Programme ausführen und sogar vollständige Präsentationen oder Tabellen erstellen. Möglich wird das durch die Kombination aus Browser-Interaktion, API-Zugriff und Terminal-Kommandos – gesteuert von einem Modell, das zwischen Denken und Handeln fließend wechselt.
KI kombiniert Recherche, Webinteraktion und Automatisierung
Die neue Agentik-Plattform basiert auf Erkenntnissen aus früheren Funktionen wie „Operator“ und „Deep Research“, die nun erstmals in einem System verschmelzen. Damit kann ChatGPT nicht nur durch Webseiten navigieren und Inhalte filtern, sondern auch tiefergehende Analysen durchführen und diese in handlungsfähige Ergebnisse wie Kalendereinträge oder Finanzmodelle überführen. Besonders in beruflichen Kontexten soll die KI repetitive Aufgaben wie Datenpflege, Terminplanung oder das Erstellen von Berichten automatisieren.
Gewinnen in der Plattform-Ökonomie
Nutzerkontrolle bleibt erhalten
Obwohl der Agent Aufgaben selbstständig ausführt, bleibt der Nutzer stets Herr des Geschehens. Aktionen mit Konsequenzen – etwa Einkäufe oder E-Mails – erfordern eine explizite Zustimmung. Zusätzlich lässt sich der Agent jederzeit pausieren oder übernehmen. Über das sogenannte „Takeover Mode“ können Nutzer sogar Passworteingaben sicher selbst tätigen, ohne dass die KI Zugriff auf sensible Daten erhält.
Leistungswerte auf Expertenniveau
Interne Benchmarks zeigen, dass der ChatGPT-Agent menschliche Leistung in vielen Aufgabenbereichen erreicht oder sogar übertrifft. So erzielt das Modell unter anderem Bestwerte auf Benchmarks wie „Humanity’s Last Exam“ oder „SpreadsheetBench“ und löst komplexe mathematische Aufgaben sowie Investmentbanking-Modelle deutlich präziser als vorherige Versionen. Dabei ist der Agent nicht nur schneller, sondern auch in der Lage, Aufgaben über mehrere Tools hinweg zu lösen.
Sicherheitsmaßnahmen gegen Missbrauch
Mit erweiterten Möglichkeiten steigen auch die Risiken. OpenAI hat deshalb ein umfassendes Sicherheitskonzept implementiert, das unter anderem vor sogenanntem Prompt Injection schützt – also manipulierten Anweisungen, die auf Webseiten versteckt sein könnten. Aktionen, die reale Konsequenzen haben, wie Banküberweisungen, werden systematisch abgelehnt. Zusätzlich wurde das Modell vorsorglich unter das höchste Bio- und Chemierisiko-Level eingeordnet, obwohl es keine Hinweise auf akute Missbrauchsmöglichkeiten gibt.
Verfügbarkeit: Vorerst nicht in Europa
Der Agent-Modus wird schrittweise für Pro-, Plus- und Team-Nutzer freigeschaltet, Enterprise- und Education-Kunden folgen. Europa muss sich noch gedulden: In der Europäischen Wirtschaftszone ist der Zugang derzeit noch nicht freigegeben. OpenAI kündigt unterdessen weitere Verbesserungen an – etwa bei der Gestaltung von Präsentationen oder der Integration zusätzlicher Anwendungen per API.


