Agenti AI in parallelo: cos’è il fan-out dei subagent
Cosa significa fare fan-out di subagent: lanciare più agenti AI in parallelo per ricerca, scrittura e verifica. Guida pratica con esempi in Claude Code.

Quando si lavora con un assistente AI, la modalità predefinita è una sola: gli chiedi una cosa, lui la fa, gli chiedi la successiva. Tutto in fila, un passo alla volta. Funziona, ma c’è un modo più rapido per i lavori grossi, e si chiama fan-out di subagent: invece di un solo agente che macina tutto in sequenza, ne lanci diversi in parallelo, ognuno su un pezzo indipendente del lavoro.
In questa guida spiego cosa significa, quando conviene davvero e come si usa in pratica, con esempi presi da Claude Code.
Cosa vuol dire “fan-out”
“Fan-out” è l’immagine di un ventaglio che si apre: da un punto centrale partono più rami contemporaneamente. Applicato agli agenti AI significa che un agente principale — chiamiamolo il regista — non esegue tutto da solo, ma delega a più agenti secondari (i subagent), ciascuno con un compito circoscritto.
Ogni subagent ha tre caratteristiche che lo rendono utile:
- Contesto isolato. Lavora nella sua finestra, senza ingombrare quella del regista. Può leggere venti file e restituire tre righe di conclusione.
- Strumenti propri. Può cercare sul web, leggere il codice, lanciare comandi, a seconda di cosa gli serve.
- Esecuzione concorrente. Parte insieme agli altri e non aspetta il loro turno.
Il regista raccoglie i risultati, li verifica e li mette insieme. Tu vedi solo la sintesi finale, non il lavorìo di ognuno.
Sequenziale contro parallelo: perché cambia il tempo
La differenza si capisce con i numeri. Immagina quattro compiti che richiedono due minuti l’uno.
- In sequenza: 2 + 2 + 2 + 2 = otto minuti.
- In parallelo: partono insieme, finisci quando termina il più lento, cioè circa due minuti.
Il guadagno non è lineare e non è gratis (lo vediamo dopo), ma su lavori divisibili la differenza è netta. La regola pratica: il fan-out conviene quando i pezzi sono indipendenti tra loro, cioè nessuno ha bisogno del risultato di un altro per partire.
Tre modi di usarlo, dallo stesso lavoro
Il fan-out si declina in due direzioni opposte, ed entrambe sono utili.
1. Un agente per ogni pezzo (lo stesso compito, dati diversi)
Devo documentare quattro moduli di un progetto. Lancio quattro agenti, uno per modulo: leggono, sintetizzano e mi restituiscono la scheda. Stesso compito ripetuto su quattro oggetti diversi.
2. Più agenti sullo stesso pezzo (compiti diversi, stesso oggetto)
Devo scrivere un articolo solido. Un agente cerca le fonti, un secondo controlla che i dati citati siano veri, un terzo propone i titoli. Tre prospettive sullo stesso testo, prodotte in contemporanea.
3. La verifica in parallelo
È la variante che alza la qualità. Quando un agente produce una conclusione, ne lancio altri due o tre con il compito esplicito di smontarla. Se la maggioranza la conferma, la tengo; se la demoliscono, la scarto. Far controllare una risposta da più “scettici” indipendenti riduce gli errori plausibili ma sbagliati, quelli che a leggerli sembrano corretti.
Come si fa in Claude Code
Claude Code mette a disposizione il meccanismo in modo diretto, con due livelli di profondità.
Chiamate parallele. Già nella conversazione normale, se i lavori sono indipendenti l’agente può eseguire più strumenti nello stesso turno invece che uno dopo l’altro. È il fan-out nella sua forma più leggera.
Subagent dedicati. Puoi definire agenti specializzati — un revisore di codice, un esploratore di file, un ricercatore — e farli lavorare in parallelo su porzioni diverse del problema. Ognuno parte con il proprio contesto pulito, fa il suo e torna con il risultato.
Per i lavori davvero grossi (una migrazione su decine di file, un audit completo, una ricerca multi-fonte) esiste l’orchestrazione vera e propria, in cui si scrive lo schema del lavoro: cosa si apre a ventaglio, cosa verifica, cosa tira le somme. Qui si possono coordinare molti agenti in fasi successive, con la verifica avversariale incorporata.
Quando il fan-out NON conviene
Il parallelo non è sempre la scelta giusta, e usarlo a sproposito fa più danni che altro.
- Compiti dipendenti. Se il passo due ha bisogno del risultato del passo uno, il parallelo non serve: vince la sequenza.
- Costo in token. Dieci agenti consumano molto più di uno. Su un lavoro piccolo paghi l’orchestrazione senza recuperarla in tempo.
- Coordinamento. Più rami significano più risultati da rileggere, riconciliare e verificare. La sintesi finale resta un lavoro serio: il regista non può fidarsi a scatola chiusa.
La domanda da farsi prima di aprire il ventaglio è sempre la stessa: questi pezzi sono davvero indipendenti, e sono abbastanza grossi da ripagare il parallelo? Se la risposta è sì, il fan-out è uno degli strumenti più efficaci che hai. Se è no, un agente in sequenza fa un lavoro più pulito.
In sintesi
Il fan-out di subagent è la differenza tra un artigiano che lavora da solo e un caposquadra che distribuisce i compiti. Non rende l’AI più intelligente: la rende più veloce sui lavori divisibili e più affidabile quando ogni conclusione viene messa alla prova da un controllore indipendente. Sapere quando aprire il ventaglio — e quando tenerlo chiuso — è la competenza che separa chi usa questi strumenti per gioco da chi ci lavora davvero.

Blogger dal 2001, Nativo Digitale, Developer.
Da 15 anni mi occupo di IT per una grande Azienda.
Lavoro per abbattere il Digital Divide.
Visita i miei altri progetti
sardiniamobility.com
www.cyberness.it