DeepSeek R1: il modello reasoning cinese che ha scosso l’industria
Il 20 gennaio 2025 DeepSeek rilascia R1, modello reasoning open-weight con performance vicine a o1 e costi di training molto bassi.

Il 20 gennaio 2025 la cinese DeepSeek rilascia R1, un modello di reasoning open-weight con licenza MIT. Nei giorni successivi il titolo NVIDIA perde quasi 600 miliardi di dollari di capitalizzazione in una sola seduta. Non succedeva da tempo che una release di un modello AI muovesse i mercati in questo modo.
Cos’è DeepSeek R1
R1 è un modello reasoning: prima di rispondere produce una catena di pensiero esplicita, visibile, in cui scompone il problema, verifica passaggi, torna indietro quando sbaglia. È lo stesso approccio di o1 di OpenAI, rilasciato a settembre 2024, ma con una differenza sostanziale: il pensiero di o1 è nascosto all’utente, quello di R1 è leggibile.
Il modello base si chiama DeepSeek-R1 ed è costruito sopra DeepSeek-V3, un mixture-of-experts da 671 miliardi di parametri totali (37 miliardi attivi per token). L’addestramento reasoning è avvenuto con reinforcement learning puro, senza passaggi intermedi di supervised fine-tuning su dati reasoning umani.
Performance: vicino a o1, non sempre sopra
I benchmark pubblicati da DeepSeek mostrano R1 alla pari o leggermente sopra o1 su diverse prove matematiche e di coding:
- AIME 2024 (matematica): R1 79.8%, o1 79.2%
- MATH-500: R1 97.3%, o1 96.4%
- Codeforces (percentile): R1 96.3, o1 96.6
- GPQA Diamond (scienza): R1 71.5%, o1 75.7%
- MMLU: R1 90.8%, o1 91.8%
La lettura onesta è che R1 è competitivo, non dominante. Su task scientifici e di conoscenza generale o1 resta davanti. Su matematica pura e coding competitivo le differenze sono nel rumore. Su task multimodali R1 non gioca: è solo testo.
Il costo che ha spaventato i mercati
DeepSeek ha dichiarato un costo di training del modello base V3 intorno ai 5.6 milioni di dollari, usando circa 2048 GPU H800 (versione depotenziata delle H100 destinata al mercato cinese sotto le restrizioni export USA). La cifra esclude ricerca precedente, fallimenti, e il training specifico di R1, ma resta di un ordine di grandezza inferiore a quello stimato per GPT-4 o o1.
Il prezzo di inference sulla API ufficiale è circa 0.55 dollari per milione di token input e 2.19 dollari per milione output. Per confronto o1 sta a 15 e 60 dollari rispettivamente. Quasi trenta volte più economico. Questa è la parte che ha colpito gli investitori: se si può fare reasoning serio a questi costi, la domanda di GPU top di gamma per inference potrebbe essere molto più bassa del previsto.
Open-weight sul serio
I pesi di R1 sono pubblicati su Hugging Face con licenza MIT. Chiunque può scaricarli, eseguirli localmente, distillarli, metterli in produzione senza restrizioni commerciali. È una scelta diversa da quella di Llama 4 di Meta, che pure è aperto ma con clausole d’uso più restrittive.
Insieme a R1 DeepSeek ha rilasciato anche sei distillati chiamati r1-distill, ottenuti trasferendo il comportamento reasoning di R1 su modelli più piccoli:
- r1-distill-Qwen-1.5B, 7B, 14B, 32B
- r1-distill-Llama-8B, 70B
Il distill da 32B raggiunge performance paragonabili a o1-mini su diverse prove, girando su una singola GPU consumer di fascia alta. È l’aspetto che interessa di più a chi vuole costruire applicazioni locali senza passare da API cloud.
Il contesto geopolitico
Le restrizioni export degli Stati Uniti sui chip AI verso la Cina, partite nel 2022 e inasprite nel 2023 e 2024, avevano come obiettivo dichiarato rallentare la corsa cinese sull’AI di frontiera. R1 dimostra che il vincolo hardware si può aggirare con efficienza algoritmica: pipeline di training più snelle, MoE aggressivo, reinforcement learning al posto di dataset umani costosi.
Non è l’unico segnale in questa direzione. Anche Kimi di Moonshot AI e gli altri laboratori cinesi stanno rilasciando modelli di livello frontiera con cadenza regolare. La narrativa per cui l’AI di frontiera era appannaggio esclusivo di tre o quattro laboratori americani si è rotta nel giro di pochi mesi.
Cosa cambia per chi sviluppa
Per un dev italiano R1 è interessante in tre scenari concreti:
- Task reasoning costosi su API dove il prezzo di o1 non sta in piedi
- Deploy on-premise per motivi di compliance o privacy, usando i distill
- Prototipazione di agent reasoning-heavy dove vedere la catena di pensiero aiuta il debug
Ci sono limiti da tenere presenti. R1 è meno bravo di o1 su task strettamente STEM non matematici. Non ha tool use nativo robusto come Claude o GPT-4o. Ha filtri cinesi sui contenuti politicamente sensibili, che su alcuni prompt producono risposte prudenti o rifiuti. Per chi costruisce applicazioni in UE questi filtri vanno testati, non dati per scontati.
Una riflessione sul mercato
La reazione dei mercati al rilascio di R1 sembra sproporzionata rispetto al contenuto tecnico. NVIDIA vende GPU anche per il training dei distill, per l’inference on-premise, per i competitor cinesi stessi. La domanda strutturale di calcolo AI non scompare perché un laboratorio pubblica un modello efficiente. Quello che cambia è la curva dei margini: se il reasoning diventa commodity a basso prezzo, il valore si sposta dall’infrastruttura alle applicazioni e ai dati.
La domanda vera non è se R1 batte o1 su un benchmark. È se un modello open con licenza MIT, eseguibile su hardware modesto, spinge i laboratori chiusi ad abbassare i prezzi o ad alzare ancora il livello. Finora la risposta sembra tutte e due le cose insieme.

Blogger dal 2001, Nativo Digitale, Developer.
Da 15 anni mi occupo di IT per una grande Azienda.
Lavoro per abbattere il Digital Divide.
Visita i miei altri progetti
sardiniamobility.com
www.cyberness.it