Was angekündigt wurde#
Anthropic hat Claude Opus 4.8 am 28. Mai 2026 veröffentlicht. Das Modell wird als das leistungsfähigste allgemein verfügbare Modell für "komplexes Schlussfolgern, langfristiges agentisches Coding und autonome Arbeit" positioniert (Anthropic-Ankündigung, Models-Übersicht). Mit diesem Release wandern Opus 4.6 und Opus 4.7 in den "Legacy"-Bereich des Modellkatalogs. Sie bleiben verfügbar, sind aber nicht mehr die empfohlene Default-Wahl.
Dieser Beitrag vergleicht die drei Opus-4.x-Releases gegeneinander auf den Punkten, die für eine Migrationsentscheidung tatsächlich zählen: Preise, Kontext, Fähigkeiten, Benchmarks und API-Features.
Auf einen Blick#
Alle drei Modelle stehen auf demselben Schild-Preis. Die Unterschiede liegen woanders.
| Opus 4.6 | Opus 4.7 | Opus 4.8 | |
|---|---|---|---|
| Release-Datum | 5. Februar 2026 | 16. April 2026 | 28. Mai 2026 |
| Modell-ID | claude-opus-4-6 | claude-opus-4-7 | claude-opus-4-8 |
| Input-Preis | $5 / MTok | $5 / MTok | $5 / MTok |
| Output-Preis | $25 / MTok | $25 / MTok | $25 / MTok |
| Kontextfenster | 1M Token | 1M Token | 1M Token (200k auf Microsoft Foundry) |
| Max. Output (synchron) | 128k Token | 128k Token | 128k Token |
| Max. Output (Batch) | 300k Token (Beta) | 300k Token (Beta) | 300k Token (Beta) |
| Extended Thinking | Ja | Nein | Nein |
| Adaptive Thinking | Ja | Ja | Ja |
| Wissens-Cutoff | Mai 2025 | Januar 2026 | Januar 2026 |
| Status | Legacy | Legacy | Aktueller Default |
Quelle: Anthropic Models-Übersicht, abgerufen am 28. Mai 2026.
Preise haben sich nicht bewegt — aber Fast Mode wurde billiger#
Der Standardpreis aller drei Opus-4.x-Modelle liegt bei $5 pro Million Input-Token und $25 pro Million Output-Token. Bis zu 90% Rabatt mit Prompt Caching und 50% mit Batch-Verarbeitung gelten auch auf Opus 4.8, wie die Opus-4.8-Ankündigung ausweist.
Was sich mit 4.8 ändert: der Fast Mode. Anthropic preist ihn mit $10 Input / $50 Output pro Million Token aus — laut Ankündigung "dreimal günstiger als der bisherige Fast Mode". Wer Produktivlasten auf Opus 4.7 Fast Mode betreibt, sieht hier eine spürbare Betriebskostenänderung. Wer im Standard-Mode bleibt, zahlt das Gleiche wie vorher.
Opus 4.6 hatte einen Aufschlag für Extended Context oberhalb von 200k Token: $10 / $37,50 pro Million Input / Output, dazu ein 1,1-fach-Multiplikator für US-only-Inferenz (Opus-4.6-Ankündigung). Auf den 4.7- und 4.8-Seiten dokumentiert Anthropic aktuell keinen vergleichbaren Aufschlag für >200k-Kontextnutzung. Die Long-Context-Ökonomie hat sich also möglicherweise geändert; bei regelmäßiger Nutzung über 200k bitte auf der eigenen Rechnung verifizieren.
Kontextfenster ist gleich — aber der Tokenizer ist ein anderer#
Alle drei Opus-4.x-Modelle werben mit einem 1M-Token-Kontextfenster und 128k Token maximalem Output in der synchronen Messages-API, sowie 300k Output-Token in der Message-Batches-API mit dem Beta-Header output-300k-2026-03-24.
Es gibt eine Fußnote, die für Kapazitätsplanung wichtig ist. Laut Modell-Dokumentation nutzt Opus 4.7 einen neuen Tokenizer gegenüber 4.6. Das heißt: 1M Token entsprechen auf 4.7 und 4.8 etwa 555k Wörtern, auf 4.6 dagegen etwa 750k Wörtern. Wer Prompt-Budgetierung über Zeichen- oder Wortzahlen kalibriert hat, sollte mit unterschiedlichem Verhalten zwischen 4.6 und 4.7/4.8 rechnen — auch wenn die Token-Obergrenze auf dem Papier identisch ist.
Plattform-Ausnahme: Auf Microsoft Foundry ist Opus 4.8 auf ein 200k-Kontextfenster begrenzt, nicht 1M. Das steht als Fußnote in der Models-Übersicht.
Thinking-Modi: die umstrittene Änderung#
Opus 4.6 unterstützte sowohl Adaptive Thinking (das Modell entscheidet selbst, wann und wie viel es denkt) als auch Extended Thinking (entwicklergesteuertes verlängertes Schlussfolgern). Ab Opus 4.7 hat Anthropic Extended Thinking entfernt und nur Adaptive Thinking behalten. Opus 4.8 folgt diesem Schema.
In der Praxis bedeutet das: Wer auf Opus 4.6 explizit Extended-Thinking-Budgets gesetzt hat, kann diese exakte Kontrolle nicht auf 4.7 oder 4.8 portieren. Der Ersatz ist der effort-Parameter mit vier Stufen — low, medium, high, max — plus einer mit 4.7 eingeführten Stufe xhigh. Auf Opus 4.8 ist effort auf allen Flächen (API, Claude Code) standardmäßig high, so die Modell-Doku. Eine andere Stufe muss explizit gesetzt werden.
Was Anthropic als Verbesserung von 4.8 gegenüber 4.7 angibt#
Die Opus-4.8-Ankündigung nennt konkrete Zuverlässigkeitszuwächse gegenüber 4.7, keine vagen "klügeren" Aussagen. Die wichtigsten:
- Code-Review: Opus 4.8 lässt "etwa viermal seltener" Fehler in Code unentdeckt durch als 4.7. Außerdem sind die in 4.7 berichteten Regressionen bei zu wortreichen Kommentaren und Tool-Calling laut Anthropic behoben.
- Agentische Aufgaben: bessere Urteilskraft und Zuverlässigkeit in mehrstufigen Workflows, effizienteres Tool-Calling (weniger Schritte für dasselbe Ergebnis).
- Citation-Präzision: verbessert bei abruflastigen Aufgaben.
- Token-Effizienz beim Retrieval: verbessert, was bei gleicher Input-Länge niedrigere Kosten beim Dokumentenlesen bedeutet.
Bei den Benchmarks veröffentlicht Anthropic:
- Super-Agent-Benchmark: Opus 4.8 ist "das einzige Modell, das jeden Fall durchgängig löst", vor älteren Opus-Modellen und kostengleich mit GPT-5.5.
- Legal Agent Benchmark: höchster je erfasster Score, "erstes Modell, das die 10%-Marke beim All-Pass-Standard knackt".
- Online-Mind2Web (Computer-Use / Browser-Agent): 84%.
- OSWorld-Verified: 82,3%.
- Terminal-Bench 2.1: schlägt GPT-5.5.
Unabhängige Reproduktionen dieser Zahlen liegen am Release-Tag nicht vor. Sie sind als Hersteller-Angaben zu lesen.
Was 4.7 gegenüber 4.6 mitbrachte#
Der Vollständigkeit halber, aus der Opus-4.7-Ankündigung:
- 13% Resolution-Lift auf einem 93-Aufgaben-internen-Coding-Benchmark gegenüber Opus 4.6.
- 98,5% auf Anthropics Visual-Acuity-Benchmark für Computer-Use, gegenüber 54,5% bei 4.6.
- State-of-the-Art auf GDPval-AA, Anthropics Eval für ökonomisch wertvolle Wissensarbeit.
- Vision-Input akzeptiert nun Bilder bis 2.576 Pixel an der langen Kante (~3,75 MP), "mehr als dreimal so groß wie bei früheren Claude-Modellen".
- Neue
xhigh-Effort-Stufe zwischenhighundmax. - Neuer Slash-Befehl
/ultrareviewfür dedizierte Code-Review-Sitzungen. - Task-Budgets in der öffentlichen Beta.
4.7 hat das Instruction-Following verschärft — Anthropic merkt explizit an, dass bestehende Prompts möglicherweise nachgezogen werden müssen, weil das Modell sie wörtlicher interpretiert als 4.6.
Was 4.6 als Ausgangspunkt brachte#
Die Opus-4.6-Ankündigung (5. Februar 2026) war der erste Opus-4.x-Release. Kernfakten:
- 1M-Token-Kontextfenster in der Beta, ursprünglich nur auf der Claude-Plattform.
- 128k Output-Token.
- GDPval-AA: schlägt GPT-5.2 um rund 144 Elo-Punkte.
- MRCR v2 (Long-Context-Retrieval): 76%, gegenüber 18,5% bei Sonnet 4.5.
- BigLaw Bench: 90,2%.
- Neu: Adaptive Thinking, vier Effort-Stufen (
low/medium/high/max), Context Compaction für lang laufende Aufgaben, Agent Teams in Claude Code (Research Preview), Claude in PowerPoint (Research Preview).
Neue API-Features mit 4.8#
Drei Features kommen laut Ankündigung zusammen mit Opus 4.8:
- Dynamische Workflows mit parallelen Subagenten, verfügbar in Enterprise-Plänen.
- Effort-Control jetzt auch in claude.ai und Cowork (vorher auf manchen Flächen nur über die API).
- System-Einträge mitten in der Aufgabe in der Messages-API — die Möglichkeit, System-Anweisungen während einer laufenden Konversation einzuspeisen, nicht nur am Session-Start.
Vor allem das Letzte ist eine Plumbing-Änderung, die wenig spektakulär aussieht, aber für agentische Workflows zählt, in denen ein Operator mitten im Lauf Kontext übergeben oder Verhalten ändern muss.
Sollte man migrieren?#
Anthropics eigener Migration-Guide ist die maßgebliche Referenz. Das Muster ist trotzdem einfach:
- Von 4.7: Gleiche Preise im Standard-Mode, gleicher Kontext, gleiche Output-Grenze, konkrete Zuverlässigkeitsgewinne bei Code-Review und agentischer Arbeit. Effort-Default ändert sich auf 4.8 auf
high— der Code sollte sich nicht auf einen anderen impliziten Default verlassen. Fast-Mode-Nutzer sehen einen 3×-Preisrückgang. - Von 4.6: Extended-Thinking-Kontrolle verliert man (Ersatz ist der Effort-Parameter), ein frischerer Wissens-Cutoff (Januar 2026 vs. Mai 2025) kommt dazu, und man bekommt alle Verbesserungen aus 4.7 und 4.8. Prompts brauchen möglicherweise ein Re-Tuning, weil 4.7 eine striktere Instruction-Interpretation eingeführt hat, die sich in 4.8 fortsetzt.
Für die meisten Produktivnutzer auf 4.6 oder 4.7 ist die Migration klein. Sorgfältig planen muss nur, wessen Prompts explizit Extended-Thinking-Budgets anfordern — denn dieser Hebel existiert nicht mehr.
Was in diesem Beitrag bewusst nicht steht#
Ein paar Dinge, die wir bewusst nicht behaupten:
- Wir haben Opus 4.8 am Release-Tag nicht selbst gebenchmarked. Die genannten Zahlen sind Hersteller-Angaben.
- Wir wissen noch nicht, ob unabhängige Drittbewertungen (LMArena, SWE-bench-Verified-Reproduktionen, Aider-Benchmarks) die agentischen Aussagen bestätigen. Diese kommen typischerweise zwei bis vier Wochen nach einem Frontier-Release.
- Das Opus-4.8-System-Card lag zum Redaktionsschluss nicht als separates PDF vor; Anthropics Release-Muster legt nahe, dass es kurzfristig folgt.
Wer KI im Produktivbetrieb fährt, fährt meist richtig mit: auf eine datierte Modell-ID pinnen, eigene Eval-Suite laufen lassen, migrieren, wenn die Zahlen auf den eigenen Aufgaben es rechtfertigen. Hersteller-Ankündigungen sind ein Signal, kein Urteil.
