BOLLETTINO OPERATIVO · GIO 18 GIU 2026 · 01:16 CET EN / IT / RSS / NEWSLETTER

GPT-5: il rilascio OpenAI di agosto 2025

GPT-5 arriva il 7 agosto 2025: routing automatico, quattro varianti, miglioramenti misurabili su coding e math. Non rivoluzionario, ma solido.

Il 7 agosto 2025 OpenAI ha rilasciato GPT-5. L’attesa era alta, la reazione della community tiepida: non il salto che tanti si aspettavano dopo GPT-4, ma un aggiornamento concreto su più fronti. Vale la pena capire cosa cambia davvero, soprattutto per chi usa l’API o ChatGPT tutti i giorni.

Il problema UX che GPT-5 risolve

Prima di GPT-5, su ChatGPT bisognava scegliere il modello a mano: GPT-4o per le risposte veloci, o1 per il ragionamento lungo, o3-mini per il compromesso. Era un problema di UX reale. L’utente medio non sa quando serve un modello “thinking” e quando basta uno “fast”, e finiva per usare sempre lo stesso anche quando non era adatto.

GPT-5 unifica i modelli dietro un router automatico. Il sistema decide da solo se la richiesta merita una risposta rapida o un passaggio di ragionamento più profondo. Non è perfetto, ma toglie una scelta inutile all’utente.

Le quattro varianti della famiglia

Il lancio include una segmentazione per costo e latenza:

  • GPT-5: il modello di punta, con routing interno
  • GPT-5 Mini: più economico, per task ad alto volume
  • GPT-5 Nano: il più piccolo, latenza minima, pensato per edge e mobile
  • GPT-5 Pro: riservato agli abbonamenti top, modalità thinking estesa sempre attiva

La logica ricalca quella che già usavano Anthropic (Haiku/Sonnet/Opus) e Google (Flash/Pro). Scegliere il modello giusto per il task resta un lavoro dello sviluppatore, ma almeno ora l’offerta è parallela tra i tre player principali.

Numeri su benchmark: coding, math, scienza

Sui benchmark ufficiali i miglioramenti ci sono e sono misurabili:

  • SWE-bench Verified (coding su issue reali GitHub): GPT-5 supera GPT-4o di oltre venti punti percentuali
  • AIME 2025 (competizione matematica): punteggi vicini al 95% in modalità thinking
  • MMLU e benchmark scientifici: incrementi singoli ma costanti
  • Allucinazioni: riduzione significativa rispetto a GPT-4o, ma non azzerate

Il punto interessante è il coding. GPT-5 sembra progettato pensando agli agenti: tool use più affidabile, meno loop inutili, gestione migliore di sessioni lunghe. Non a caso il lancio è arrivato poche settimane dopo ChatGPT Agent e Codex CLI, due prodotti che su GPT-5 girano meglio.

Confronto con Claude Opus 4.1 e Gemini 2.5 Pro

È il primo rilascio OpenAI che si confronta direttamente con modelli già molto solidi lato concorrenza. Claude Opus 4.1 di Anthropic resta fortissimo su coding lungo e reasoning strutturato. Gemini 2.5 Pro di Google ha il vantaggio del contesto da un milione di token e dell’integrazione con Workspace.

Sui benchmark pubblici GPT-5 riprende la testa in diverse categorie, ma i distacchi sono piccoli. Non è più lo scenario “OpenAI avanti di un anno” del 2023. I tre modelli ora giocano nello stesso campionato, con punti di forza diversi.

Pricing e disponibilità

Il listino API è allineato ai competitor, senza sorprese. GPT-5 costa in linea con Claude Sonnet e Gemini Pro sulla fascia media. Il dettaglio interessante è il cache hit: riusare lo stesso prompt di sistema o lo stesso contesto costa una frazione del prezzo pieno. Per chi fa chatbot o agenti con prompt lunghi ripetuti, la differenza in bolletta a fine mese è concreta.

Disponibilità: GPT-5 è immediatamente attivo su ChatGPT (Plus, Pro, Team, Enterprise) e via API per tutti gli sviluppatori. Nano e Mini hanno rollout graduale. Pro è legato al piano ChatGPT Pro.

Perché la community si aspettava di più

Dopo GPT-4 la barra era altissima. Sam Altman aveva alimentato l’attesa per mesi, anche con dichiarazioni sibilline su un modello “che potrebbe spaventare”. Quando il prodotto è arrivato, molti si sono trovati davanti un aggiornamento ottimo ma non dirompente.

Il frame “non rivoluzionario” è però un po’ ingeneroso. I numeri sui benchmark dicono che GPT-5 è meglio di tutto quello che OpenAI aveva rilasciato prima, e il routing unificato è un miglioramento di prodotto che GPT-4 non aveva. Il problema è che la curva degli LLM si sta appiattendo: i salti diventano più piccoli, più specialistici, meno cinematografici.

Cosa guardare nei prossimi mesi

Due cose vale la pena monitorare. La prima: come si comporta il router automatico su carichi produttivi. Se sbaglia troppo spesso verso il modello fast quando servirebbe thinking, gli sviluppatori torneranno a esporre il controllo manuale via API.

La seconda: la risposta di Anthropic e Google. Opus 4.1 è recente, ma Claude 5 è nei rumor. Gemini 3 pure. GPT-5 rialza l’asticella, non la riscrive. Chi scommetteva su un vincitore unico nel mercato LLM resta smentito: nel 2026 avremo ancora tre modelli di punta paragonabili, con l’utente che sceglie in base al task.

Vale poi la pena chiedersi: è ancora sensato parlare di “generazioni” GPT? Quando tra GPT-4 e GPT-5 passano tanti modelli intermedi (4o, o1, o3, o3-mini), il numero grosso inizia a contare meno. Forse la prossima volta OpenAI smetterà di incrementarlo e passerà a nomi di prodotto, come hanno fatto gli altri.