Claude Opus 4.6 e il milione di token: cosa cambia davvero
Claude Opus 4.6 porta un milione di token di contesto a prezzo standard. Cosa si può fare davvero, quanto costa e quando conviene usarlo sul serio.

Anthropic ha rilasciato Claude Opus 4.6 il 5 febbraio 2026, e a marzo ha reso generalmente disponibile la finestra di contesto da 1 milione di token. Vale la pena capire cosa significa, concretamente, per chi scrive codice e per chi lavora con documenti lunghi. Non è solo un numero più grosso: è un cambio di abitudini.
Cos’è Opus 4.6 e cosa cambia rispetto a 4.5
Opus 4.6 è il modello di punta di Anthropic, quello pensato per agenti e coding. Sulla carta eredita lo stesso prezzo di Opus 4.5, ma cambia parecchio sotto il cofano. L’output massimo sale a 128.000 token per risposta, arriva la modalità di pensiero adattivo (il modello decide da solo quanto ragionare) e spunta la Compaction API, che riassume in automatico le parti vecchie di una conversazione lunga. Piccoli dettagli che insieme fanno una differenza grossa quando lo si usa per ore di fila.
Sui benchmark di coding (SWE-bench Verified) Opus 4.6 si colloca circa all’80%, in linea con la versione precedente. L’upgrade non è sul punteggio assoluto, è sul comportamento agentico: pianifica meglio, sostiene task lunghi, si corregge da solo più spesso.
Il milione di token, spiegato bene
Un milione di token sono circa 750.000 parole. In pratica: l’intera codebase di un progetto medio, centinaia di pagine di documentazione, mesi di log, o un romanzo più l’indice delle citazioni. Tutto dentro una sola richiesta, senza dover spezzare o fare retrieval casalingo.
La differenza chiave rispetto al passato è che ora, secondo Anthropic, non c’è più il sovrapprezzo per contesti lunghi: una richiesta da 900.000 token costa allo stesso tariffario per token di una richiesta da 9.000. Era il vero freno: prima pagavi il doppio oltre certe soglie.
Prezzi reali e cosa significano
- Input: 5 dollari per milione di token
- Output: 25 dollari per milione di token
- Cache hit: 0,50 dollari per milione di token (il 10% del prezzo pieno)
- Batch API: sconto del 50% su input e output
Tradotto: mandargli in pasto una codebase da 500.000 token costa circa 2,50 dollari di input. Se la tieni in cache e ci torni sopra per una sessione di lavoro, scende intorno ai 25 centesimi per chiamata. Meno di un caffè. Il vero costo è l’output, come sempre: 25 dollari per milione significa che una risposta lunga di 20.000 token pesa 50 centesimi.
A cosa serve davvero: casi concreti
Gli scenari in cui il milione di token smette di essere marketing e diventa utile sono pochi ma molto specifici:
- Refactoring cross-file: vedere tutto il progetto in una volta sola evita le allucinazioni tipiche quando il modello non sa cosa c’è nel file accanto
- Code review su pull request grosse: tre o quattromila righe modificate più il contesto dei file toccati, senza dover selezionare a mano
- Audit legale o contrattuale: centinaia di pagine di documenti con riferimenti incrociati
- Debugging su log lunghi: ore di log applicativi più la porzione di codice relativa, tutto nello stesso prompt
- Sessioni agentiche lunghe: agenti che lavorano per ore senza perdere il filo del task iniziale
Il verdetto
Il milione di token è utile sul serio in una minoranza dei casi. Per il 90% del lavoro quotidiano, 200.000 token bastano e avanzano, costano meno e il modello è più preciso (i test interni di Anthropic e le coperture indipendenti segnalano che il recall cala quando ci si avvicina al limite superiore, anche se Opus 4.6 regge meglio degli altri).
La regola pratica: se devi spezzare manualmente il prompt o fare finta di essere un sistema di retrieval, passa a Opus 4.6 e caricalo pieno. Se invece stai chattando con un paio di file, Sonnet 4.6 a 3 dollari per milione di token fa lo stesso lavoro e costa un terzo. Opus 4.6 si paga quando il contesto lungo è il tuo collo di bottiglia, non quando è un vezzo.
La domanda onesta da farsi è: nel mio workflow, quante volte in un mese mi serve davvero tenere mezzo repository in un solo prompt?
Leggi anche
- Claude Code: il CLI di Anthropic che ha normalizzato il vibe coding
- Claude Haiku 4.5: quando il modello veloce conviene davvero

Blogger dal 2001, Nativo Digitale, Developer.
Da 15 anni mi occupo di IT per una grande Azienda.
Lavoro per abbattere il Digital Divide.
Visita i miei altri progetti
sardiniamobility.com
www.cyberness.it