Claude Sonnet 5: Opus-Niveau zum Sonnet-Preis

Claude Sonnet 5 ist da: agentisches Niveau nah an Opus 4.8, aber zu einem Bruchteil des Preises. Was das für Coding, Automatisierung und die Modell-Wahl heißt.

30. Juni 20265 min LesezeitKI

Claude Sonnet 5: Opus-Niveau zum Sonnet-Preis

Artikel anhören0:00

Was Anthropic mit Sonnet 5 vorlegt

Anthropic hat am 30. Juni 2026 Claude Sonnet 5 veröffentlicht und nennt es das bislang agentischste Sonnet-Modell. Es plant selbst, bedient Werkzeuge wie Browser und Terminal und läuft autonom auf einem Niveau, das vor wenigen Monaten noch größeren und teureren Modellen vorbehalten war. Die mittlere Klasse rückt damit an die Spitze, ohne deren Preis aufzurufen. Das offizielle Announcement steht bei Anthropic.

Der Punkt, der das Release interessant macht, steckt im Abstand zur Spitze. Sonnet 5 liegt bei den agentischen Kernfähigkeiten nah an Opus 4.8, dem teuren Flaggschiff, kostet aber einen Bruchteil. Gegenüber dem direkten Vorgänger Sonnet 4.6 ist es ein klarer Sprung. Für alle, die KI nicht zum Spielen, sondern im Tagesgeschäft einsetzen, ist genau dieser Abstand die eigentliche Nachricht.

Was die Benchmarks zeigen

Anthropic stellt Sonnet 5 in einer Tabelle gegen Sonnet 4.6 und Opus 4.8. Auf SWE-bench Pro, dem agentischen Coding-Benchmark, kommt Sonnet 5 auf 63,2 Prozent, deutlich vor dem Vorgänger (58,1) und in Sichtweite von Opus 4.8 (69,2). Auf Terminal-Bench 2.1 sind es 80,4 Prozent, fast gleichauf mit Opus (82,7) und weit vor 4.6 (67,0). Bei der Computernutzung (OSWorld-Verified) liegen alle drei eng beieinander: 81,2 zu 78,5 zu 83,4.

Balkendiagramm: Sonnet 5 zwischen Sonnet 4.6 und Opus 4.8 auf SWE-bench Pro (63,2 zu 58,1 zu 69,2 Prozent), Terminal-Bench 2.1 (80,4 zu 67,0 zu 82,7 Prozent), Humanity's Last Exam mit Tools (57,4 zu 46,8 zu 57,9 Prozent) und OSWorld-Verified (81,2 zu 78,5 zu 83,4 Prozent). — Sonnet 5 gegen den Vorgänger Sonnet 4.6 und das Flaggschiff Opus 4.8 auf vier agentischen Benchmarks. Daten: Anthropic (30. Juni 2026). Visualisierung: Pixzl.

Die Zahl, an der wir hängengeblieben sind, steht etwas abseits: praktische Wissensarbeit (GDPval). Dort erreicht Sonnet 5 einen Wert von 1618 und liegt damit minimal über Opus 4.8 (1615), während Sonnet 4.6 mit 1395 deutlich abfällt. Bei dieser Aufgabenklasse ist das mittlere Modell beim großen angekommen. Genau solche Zahlen geben bei der Modell-Wahl den Ausschlag.

Der eigentliche Hebel: Effort und Preis

Spannender als jede einzelne Benchmark-Zahl ist, wie Anthropic Sonnet 5 positioniert. Zwischen Sonnet 5 und Opus 4.8 lässt sich ein Effort-Level einstellen, also wie viel Rechenaufwand das Modell in eine Aufgabe steckt. Auf der agentischen Suche (BrowseComp) zeigt Anthropic Kurven, die genau das illustrieren: Sonnet 5 ist auf jeder Stufe besser als 4.6, Opus 4.8 erreicht bei hohem Aufwand höhere Genauigkeit, aber Sonnet 5 liefert dieselbe Klasse Ergebnis zu spürbar niedrigeren Kosten. Statt Modell zu wechseln, dreht man am Aufwand.

Balkendiagramm der Token-Preise: Input pro Million Token kostet bei Sonnet 5 zwei Dollar zum Einführungspreis, drei Dollar regulär, bei Opus 4.8 fünf Dollar. Output pro Million Token kostet bei Sonnet 5 zehn Dollar zum Einführungspreis, fünfzehn Dollar regulär, bei Opus 4.8 fünfundzwanzig Dollar. — Token-Preise in US-Dollar pro Million Token. Sonnet 5 liegt regulär bei rund 60 Prozent der Opus-4.8-Kosten, bis zum 31. August 2026 noch darunter. Daten: Anthropic (30. Juni 2026). Visualisierung: Pixzl.

Das schlägt direkt auf die Rechnung durch. Sonnet 5 kostet regulär drei Dollar pro Million Input-Token und fünfzehn Dollar pro Million Output-Token. Opus 4.8 liegt bei fünf beziehungsweise fünfundzwanzig. Bis zum 31. August 2026 gilt für Sonnet 5 sogar ein Einführungspreis von zwei und zehn Dollar. Wer Aufgaben hat, die bisher nur Opus zugetraut wurden, kann sie jetzt für deutlich weniger Geld an Sonnet 5 geben und behält über das Effort-Level die Reißleine.

Ein Detail für Entwickler: Sonnet 5 nutzt einen aktualisierten Tokenizer. Derselbe Text kann je nach Inhalt 1,0 bis 1,35-mal so viele Token ergeben wie vorher. Der Einführungspreis ist so gesetzt, dass der Umstieg von Sonnet 4.6 ungefähr kostenneutral bleibt. Nach dem 31. August sollte man die echten Verbräuche einmal nachrechnen, statt blind auf den Token-Preis zu schauen.

Was Tester berichten

Anthropic zitiert zwei Early-Access-Partner, und beide Aussagen zielen auf dasselbe. Factory beschreibt Sonnet 5 als belastbare Ausführungsschicht für mehrschrittige Software-Aufgaben, gut über unübersichtliche technische Kontexte hinweg, stark dort, wo es auf Durchhalten und technische Erdung ankommt. Zapier hat dem Modell einen zweiteiligen Auftrag gegeben, Salesforce-Stufen aktualisieren und eine Ankündigung an Enterprise-Kontakte schicken, und es lief von Anfang bis Ende durch, eine Aufgabe, die vorher auf halber Strecke hängenblieb.

Das deckt sich mit dem, was wir an dem Release für entscheidend halten. Frühere Sonnet-Modelle waren schnell und günstig, sind in längeren autonomen Läufen aber oft zu früh stehengeblieben. Genau da setzt Sonnet 5 an.

Sicherheit und Cyber

Bei der Sicherheit meldet Anthropic einen Fortschritt gegenüber 4.6. Sonnet 5 weist bösartige Anfragen zuverlässiger ab, hält Prompt-Injection-Angriffen besser stand und halluziniert seltener. Auf der internen Messung für fehlausgerichtetes Verhalten liegt es mit 2,53 unter dem Vorgänger (2,89), also sicherer. Ganz an Opus 4.8 (2,10) oder das hauseigene Best-Aligned-Modell Mythos Preview (1,95) reicht es nicht heran. Für die meisten Web- und Automatisierungsprojekte ist das unkritisch, in regulierten Branchen ist es ein Punkt, den man bei der Modell-Wahl mitnimmt.

Balkendiagramm: Fehlausgerichtetes Verhalten im automatischen Alignment-Test, Score 1 bis 10, niedriger ist besser. Sonnet 4.6 erreicht 2,89, Mythos Preview 1,95, Opus 4.8 2,10 und Sonnet 5 2,53. — Fehlausgerichtetes Verhalten im automatischen Alignment-Test. Sonnet 5 liegt unter dem Vorgänger 4.6, aber über Opus 4.8 und dem Best-Aligned-Modell Mythos Preview. Daten: Anthropic (30. Juni 2026). Visualisierung: Pixzl.

Beim Thema Cyber bleibt Anthropic vorsichtig. Sonnet 5 wurde nicht gezielt auf Sicherheitsaufgaben trainiert und schneidet beim Entwickeln von Exploits deutlich schwächer ab als Opus 4.8 oder Mythos 5. Weil es trotzdem etwas stärker ist als der Vorgänger, startet es mit aktiven Cyber-Schutzmaßnahmen, denselben wie bei Opus 4.7 und 4.8. Das ist die nüchterne Variante von Sicherheitskommunikation, kein großer Wurf, aber transparent.

Verfügbarkeit und Preis

Sonnet 5 ist ab sofort überall verfügbar. Für die Free- und Pro-Pläne ist es das neue Standardmodell, in Max, Team und Enterprise ist es ebenfalls da, dazu in Claude Code und auf der Claude-Plattform. Über die API läuft es unter dem Kürzel claude-sonnet-5. Anthropic hat parallel die Rate Limits über Chat, Cowork, Claude Code und Plattform angehoben, damit die höheren Effort-Stufen praktikabel bleiben.

Was das für Projekte heißt

Aus unserer Sicht ist Sonnet 5 das Release, das die Kosten-Frage in agentischen Setups neu stellt. Bisher lief die Faustregel: das große Modell für die kniffligen Läufe, das mittlere für den Rest. Sonnet 5 verschiebt diese Grenze spürbar nach oben. Eine ganze Klasse von Aufgaben, für die wir bisher Opus angesetzt hätten, ist jetzt auf Sonnet machbar, und über das Effort-Level behält man die Kontrolle, wann sich der Mehraufwand lohnt.

Was sich nicht ändert: Die Verantwortung bleibt beim Menschen. Ein agentisches Modell, das einen mehrschrittigen Auftrag durchzieht, ersetzt kein Code-Review und keine Architektur-Entscheidung. Es verschiebt die Strecke, die man dem Modell überlässt, bevor jemand draufschaut. Und es senkt den Preis, zu dem man diese Strecke einkauft.

Wenn bei euch gerade die Frage aufkommt, welches Modell an welche Stelle im eigenen Stack gehört, von Coding-Assistenten bis zu Automatisierungs-Pipelines, sprecht uns gerne an. Wir helfen Unternehmen, diese Entscheidung mit Blick auf echte Kosten zu treffen statt auf Anbieter-Folien.

#Claude #Anthropic #KI #Coding

Beitrag teilen

Autor

Dominik Rieken

Gründer & Geschäftsführer, Pixzl