GPT-5: il rilascio OpenAI di agosto 2025
GPT-5 arriva il 7 agosto 2025: routing automatico, quattro varianti, miglioramenti misurabili su coding e math. Non rivoluzionario, ma solido.

Il 7 agosto 2025 OpenAI ha rilasciato GPT-5. L’attesa era alta, la reazione della community tiepida: non il salto che tanti si aspettavano dopo GPT-4, ma un aggiornamento concreto su più fronti. Vale la pena capire cosa cambia davvero, soprattutto per chi usa l’API o ChatGPT tutti i giorni.
Il problema UX che GPT-5 risolve
Prima di GPT-5, su ChatGPT bisognava scegliere il modello a mano: GPT-4o per le risposte veloci, o1 per il ragionamento lungo, o3-mini per il compromesso. Era un problema di UX reale. L’utente medio non sa quando serve un modello “thinking” e quando basta uno “fast”, e finiva per usare sempre lo stesso anche quando non era adatto.
GPT-5 unifica i modelli dietro un router automatico. Il sistema decide da solo se la richiesta merita una risposta rapida o un passaggio di ragionamento più profondo. Non è perfetto, ma toglie una scelta inutile all’utente.
Le quattro varianti della famiglia
Il lancio include una segmentazione per costo e latenza:
- GPT-5: il modello di punta, con routing interno
- GPT-5 Mini: più economico, per task ad alto volume
- GPT-5 Nano: il più piccolo, latenza minima, pensato per edge e mobile
- GPT-5 Pro: riservato agli abbonamenti top, modalità thinking estesa sempre attiva
La logica ricalca quella che già usavano Anthropic (Haiku/Sonnet/Opus) e Google (Flash/Pro). Scegliere il modello giusto per il task resta un lavoro dello sviluppatore, ma almeno ora l’offerta è parallela tra i tre player principali.
Numeri su benchmark: coding, math, scienza
Sui benchmark ufficiali i miglioramenti ci sono e sono misurabili:
- SWE-bench Verified (coding su issue reali GitHub): GPT-5 supera GPT-4o di oltre venti punti percentuali
- AIME 2025 (competizione matematica): punteggi vicini al 95% in modalità thinking
- MMLU e benchmark scientifici: incrementi singoli ma costanti
- Allucinazioni: riduzione significativa rispetto a GPT-4o, ma non azzerate
Il punto interessante è il coding. GPT-5 sembra progettato pensando agli agenti: tool use più affidabile, meno loop inutili, gestione migliore di sessioni lunghe. Non a caso il lancio è arrivato poche settimane dopo ChatGPT Agent e Codex CLI, due prodotti che su GPT-5 girano meglio.
Confronto con Claude Opus 4.1 e Gemini 2.5 Pro
È il primo rilascio OpenAI che si confronta direttamente con modelli già molto solidi lato concorrenza. Claude Opus 4.1 di Anthropic resta fortissimo su coding lungo e reasoning strutturato. Gemini 2.5 Pro di Google ha il vantaggio del contesto da un milione di token e dell’integrazione con Workspace.
Sui benchmark pubblici GPT-5 riprende la testa in diverse categorie, ma i distacchi sono piccoli. Non è più lo scenario “OpenAI avanti di un anno” del 2023. I tre modelli ora giocano nello stesso campionato, con punti di forza diversi.
Pricing e disponibilità
Il listino API è allineato ai competitor, senza sorprese. GPT-5 costa in linea con Claude Sonnet e Gemini Pro sulla fascia media. Il dettaglio interessante è il cache hit: riusare lo stesso prompt di sistema o lo stesso contesto costa una frazione del prezzo pieno. Per chi fa chatbot o agenti con prompt lunghi ripetuti, la differenza in bolletta a fine mese è concreta.
Disponibilità: GPT-5 è immediatamente attivo su ChatGPT (Plus, Pro, Team, Enterprise) e via API per tutti gli sviluppatori. Nano e Mini hanno rollout graduale. Pro è legato al piano ChatGPT Pro.
Perché la community si aspettava di più
Dopo GPT-4 la barra era altissima. Sam Altman aveva alimentato l’attesa per mesi, anche con dichiarazioni sibilline su un modello “che potrebbe spaventare”. Quando il prodotto è arrivato, molti si sono trovati davanti un aggiornamento ottimo ma non dirompente.
Il frame “non rivoluzionario” è però un po’ ingeneroso. I numeri sui benchmark dicono che GPT-5 è meglio di tutto quello che OpenAI aveva rilasciato prima, e il routing unificato è un miglioramento di prodotto che GPT-4 non aveva. Il problema è che la curva degli LLM si sta appiattendo: i salti diventano più piccoli, più specialistici, meno cinematografici.
Cosa guardare nei prossimi mesi
Due cose vale la pena monitorare. La prima: come si comporta il router automatico su carichi produttivi. Se sbaglia troppo spesso verso il modello fast quando servirebbe thinking, gli sviluppatori torneranno a esporre il controllo manuale via API.
La seconda: la risposta di Anthropic e Google. Opus 4.1 è recente, ma Claude 5 è nei rumor. Gemini 3 pure. GPT-5 rialza l’asticella, non la riscrive. Chi scommetteva su un vincitore unico nel mercato LLM resta smentito: nel 2026 avremo ancora tre modelli di punta paragonabili, con l’utente che sceglie in base al task.
Vale poi la pena chiedersi: è ancora sensato parlare di “generazioni” GPT? Quando tra GPT-4 e GPT-5 passano tanti modelli intermedi (4o, o1, o3, o3-mini), il numero grosso inizia a contare meno. Forse la prossima volta OpenAI smetterà di incrementarlo e passerà a nomi di prodotto, come hanno fatto gli altri.

Blogger dal 2001, Nativo Digitale, Developer.
Da 15 anni mi occupo di IT per una grande Azienda.
Lavoro per abbattere il Digital Divide.
Visita i miei altri progetti
sardiniamobility.com
www.cyberness.it