BOLLETTINO OPERATIVO · GIO 18 GIU 2026 · 00:49 CET EN / IT / RSS / NEWSLETTER

Gemini 2.5 Pro e Deep Research: Google risponde a OpenAI

Gemini 2.5 Pro arriva con 2 milioni di token di contesto e la funzione Deep Research che naviga il web e scrive report strutturati.

A marzo 2025 Google ha annunciato Gemini 2.5 Pro, il modello che DeepMind presenta come il primo della famiglia “thinking” di default: reasoning nativo, finestra di contesto da 1 milione di token in rollout (con 2 milioni in arrivo) e ingressi multimodali su testo, immagini, audio e video. Insieme al modello, Google ha esteso Deep Research, la feature agent che scandaglia il web al posto tuo e restituisce un report organizzato. La mossa arriva a poche settimane dal Deep Research di OpenAI e chiude un inseguimento che durava da mesi.

Cosa cambia con Gemini 2.5 Pro

Il salto principale è il reasoning integrato. Come DeepSeek R1 e o1 di OpenAI, il modello “pensa” prima di rispondere, scomponendo il problema in passaggi intermedi. La differenza rispetto ai concorrenti, stando ai benchmark che Google ha pubblicato, è sulle prove di matematica e coding: GPQA, AIME 2025, SWE-bench Verified. Numeri sempre da prendere con le pinze, ma la tendenza è coerente con quello che si vede usandolo su problemi reali.

Il contesto lungo resta il cavallo di battaglia di Google. Con 1-2 milioni di token si può caricare un codebase intero, un libro, o ore di trascrizione audio senza dover ricorrere a RAG. Non è una novità assoluta (Gemini 1.5 aveva già questa capacità), ma 2.5 Pro la usa meglio: le risposte su porzioni lontane del contesto sono più precise, soprattutto sui task di ricerca informazioni in documenti lunghi.

Deep Research: come funziona

Deep Research è la funzione accessibile dall’app Gemini (piano Advanced). Funziona così:

  1. Si pone una domanda complessa: “fammi un’analisi del mercato degli SSD consumer 2024 con trend prezzo e quote produttori”
  2. Gemini propone un piano di ricerca (sotto-argomenti, angoli da coprire)
  3. Si approva o si modifica il piano
  4. L’agent naviga fra 10 e 50 fonti web, legge, prende appunti
  5. In 5-10 minuti produce un report strutturato con citazioni

Il report arriva in formato documento con sezioni, bullet, tabelle se servono, e link alle fonti consultate. Esportabile direttamente in Google Docs. Su domande di mercato, stato dell’arte tecnico e analisi competitor, il risultato è spesso usabile come bozza di lavoro.

Dove funziona bene

  • Ricerche di mercato con numeri recenti (report, comunicati stampa, filing)
  • Panoramiche su tecnologie emergenti: confronto fra 5-10 tool, pro e contro
  • Analisi competitor: feature, pricing, posizionamento
  • Sintesi di letteratura tecnica quando le fonti sono in chiaro
  • Riassunti di eventi complessi che attraversano molti articoli

Il valore sta nel non dover aprire 40 tab, leggerli e incollarli in un documento. Una ricerca che richiede due ore di lavoro umano arriva in dieci minuti a un livello di qualità dignitoso. Non finito, non da pubblicare, ma utile come punto di partenza.

Dove zoppica

I limiti sono gli stessi di tutti gli agent di ricerca web:

  • Citazioni a volte sbagliate o inventate: il link porta a un articolo che non contiene la frase citata
  • Fonti di qualità molto variabile: Wikipedia, blog marketing, articoli SEO-first, tutto mischiato
  • Fatica sui contenuti dietro paywall (sole accademiche, riviste specializzate)
  • Tempo di attesa: 5-10 minuti sono accettabili ma non immediati
  • Difficoltà con query ambigue: se il piano di ricerca parte storto, il report è storto

Vale la regola di sempre: il report è una bozza, non un documento finito. Ogni numero critico va verificato alla fonte. Ogni citazione importante va aperta e letta. Se si salta questo passaggio, prima o poi si pubblica un dato sbagliato con la faccia propria sopra.

Gemini vs ChatGPT Deep Research

OpenAI aveva rilasciato Deep Research poche settimane prima, basato su una variante di o3. Il confronto diretto è ancora acerbo, ma le prime osservazioni convergono su due punti. ChatGPT tende a produrre report più densi di analisi e meno di link, con un tono più “consulente”. Gemini ha report più schematici, con tabelle comparative spesso migliori, e un’integrazione nativa con Google Docs che per chi lavora in Workspace è un vantaggio concreto.

Sul puro reasoning (matematica, logica) i due sembrano vicini, con Gemini 2.5 Pro avanti su qualche benchmark. Sul contesto lungo Google resta davanti: OpenAI non ha ancora portato o3 a milioni di token.

L’ecosistema Google si muove

Deep Research è un pezzo di un disegno più grande. Google sta mettendo AI dentro tutti i prodotti che ha: NotebookLM con gli Audio Overview, Gemini CLI per il terminale, Jules agent di coding asincrono. Ognuno copre un flusso diverso, tutti condividono il modello sottostante.

Dopo un 2023 di inseguimento a OpenAI e un 2024 di annunci misti, nel 2025 Google è rientrato nella corsa vera. Non è la prima volta che succede: la storia di DeepMind ha avuto molte stagioni. Ma il combinato Gemini 2.5 Pro + Deep Research è la cosa più solida uscita da Mountain View da tempo.

Chi dovrebbe provarlo

Chi lavora già in Google Workspace ha il minor attrito: Deep Research sputa direttamente in Docs, Gemini è integrato in Gmail, Meet, Drive. Chi fa ricerca di mercato, scouting tecnologico, analisi competitor dovrebbe metterlo nel flusso di lavoro accanto a ChatGPT e Claude, non in alternativa. Ogni modello ha un carattere diverso e i report sono più utili se si confrontano due fonti.

La domanda onesta è quanto dei task di “documento di background” in azienda finirà per essere fatto così, con un agent che fa il primo 70% e una persona che rifinisce il resto. Probabilmente parecchi, nei prossimi due anni. Poi servirà qualcuno capace di distinguere il report buono da quello con citazioni inventate, e quello resta lavoro umano.