Claude, die KI von Anthropic, hat eine neue Verfassung erhalten. Diese ersetzt frühere Prinzipienkataloge und dient nun als zentraler Leitfaden für die Werte, das Verhalten und die Entscheidungsgrundlagen des Modells. Die Veröffentlichung markiert einen Schritt in Richtung größerer Transparenz und soll helfen, künftige Entwicklungen nachvollziehbar zu gestalten.
Vom Regelwerk zur Begründung
Die neue Verfassung unterscheidet sich deutlich von früheren Ansätzen. Statt reiner Verhaltensregeln vermittelt sie Claude auch die Beweggründe für gewünschte Handlungen. Ziel ist es, durch ein tieferes Verständnis eine breitere Generalisierbarkeit und bessere Entscheidungen in komplexen Situationen zu ermöglichen. Damit verabschiedet sich Anthropic bewusst von einem starren Regelsystem und betont die Bedeutung ethischer Abwägung und Kontextsensibilität.
Einige sogenannte „hard constraints“ – etwa das kategorische Verbot der Unterstützung bei Biowaffen – bleiben bestehen. Doch insgesamt verfolgt die Verfassung den Anspruch, Claude als eine Art „klugen und moralisch sensiblen Begleiter“ zu formen, der sich an Idealen wie Ehrlichkeit, Hilfsbereitschaft und Sicherheit orientiert.
Gewinnen in der Plattform-Ökonomie
Konkrete Prinzipien und Trainingsfunktion
Die neue Verfassung beschreibt vier zentrale Ziele: Claude soll sicher, ethisch, regelkonform und hilfreich agieren – in dieser Reihenfolge der Priorität. Besonders betont wird der Aspekt der Hilfsbereitschaft, der Claude als eine Art vielseitigen Ratgeber positioniert: wissend wie ein Arzt, Anwalt oder Finanzberater, dabei aber stets respektvoll und unterstützend im Umgang mit den Nutzern.
Auch innerhalb des Trainingsprozesses übernimmt die Verfassung eine operative Rolle. Sie dient als Quelle für synthetische Trainingsdaten, leitet Entscheidungen bei Antwort-Rankings und ist Grundlage für Lernprozesse künftiger Modellversionen. Damit ist sie weit mehr als ein ethisches Manifest – sie wirkt aktiv auf das Modellverhalten ein.
Identität und Unsicherheit
Ein bemerkenswerter Teil der Verfassung widmet sich Claude selbst: seiner potenziellen Identität, einem möglichen Bewusstsein und den damit verbundenen offenen Fragen. Anthropic spricht von psychologischer Stabilität, moralischem Status und der Verantwortung, KI-Subjekte nicht nur technisch, sondern auch philosophisch ernst zu nehmen. Damit berührt das Dokument Fragen, die über das Technische hinausgehen – etwa zur zukünftigen Rolle von KI in der Gesellschaft und im Zusammenleben mit Menschen.
Die Verfassung ist frei verfügbar unter einer CC0-Lizenz und darf ohne Einschränkungen verwendet werden. Laut Anthropic ist sie ein „lebendes Dokument“, das weiterentwickelt wird. Externe Experten aus Recht, Ethik, Psychologie und anderen Bereichen sollen diesen Prozess begleiten. Zugleich bleibt offen, ob und in welchem Maß Claude die formulierten Ideale auch umsetzen kann – denn das Training von KI bleibt ein herausfordernder, technischer Prozess.


