BOLLETTINO OPERATIVO · VEN 12 GIU 2026 · 04:18 CET EN / IT / RSS / NEWSLETTER

OpenAI svela MRC: il protocollo open per i cluster GPU del prossimo decennio

OpenAI pubblica un paper congiunto con Microsoft, AMD, Broadcom, Nvidia e Intel su un nuovo protocollo di rete per cluster GPU. Si chiama MRC ed è già in produzione sui supercomputer che hanno addestrato GPT-5.5.

Il 5 maggio 2026 OpenAI ha pubblicato un paper congiunto con ricercatori di Microsoft, AMD, Broadcom, Nvidia e Intel. Il documento descrive un nuovo protocollo di rete pensato specificamente per cluster di GPU di scala estrema, denominato MRC (Multipath Reliable Connection). Il rilascio è sotto licenza aperta tramite l’Open Compute Project.

L’aspetto significativo non è solo tecnico: è il pattern. Cinque dei più grandi protagonisti del settore hardware AI mettono a fattor comune un protocollo open invece di tenerselo come vantaggio competitivo. La motivazione dichiarata: la frammentazione del settore con protocolli proprietari è un freno per tutti.

Il problema che MRC risolve

I cluster di GPU che servono il training dei modelli frontier hanno raggiunto una dimensione in cui la rete che li interconnette è un collo di bottiglia critico. Due problemi specifici:

  • congestione: il traffico tra GPU genera colli di bottiglia che lasciano parti del cluster sotto-utilizzate;
  • guasti: in cluster da decine di migliaia di GPU, qualcosa va sempre in down, e oggi il fallimento di un singolo path costringe il job a fermarsi.

Cosa fa MRC

Il protocollo introduce due meccanismi:

  • packet spraying: i dati vengono distribuiti su centinaia di percorsi di rete simultaneamente, evitando che un singolo link congestionato diventi il collo di bottiglia. La rete diventa più flat, riducendo il numero di tier e quindi il consumo energetico;
  • rerouting in microsecondi: quando un path va giù, MRC lo rileva e devia il traffico in tempi tali da non interrompere il training. Il job continua, anche se parti della rete si guastano.

MRC è integrato con SRv6 (IPv6 Segment Routing), che indica al pacchetto il percorso esatto da seguire senza chiedere agli switch di calcolarlo. Risultato: meno consumo energetico negli switch, meno calore, meno costo operativo del data center.

Già in produzione

MRC non è un’idea da paper: secondo OpenAI, è già in produzione nei cluster di training più grandi della società. Tra questi:

  • il sito Stargate di Oracle a Abilene (Texas);
  • i supercomputer Fairwater di Microsoft.

È stato usato per il training di GPT-5.5 e di modelli successivi. La specifica è disponibile attraverso l’Open Compute Project.

Perché interessa anche chi non gestisce un data center

Per il singolo sviluppatore o per la PMI italiana, MRC sembra lontano. Non lo è, per due ragioni indirette:

  • il prezzo del compute: MRC è uno dei tre fattori che spingono al ribasso il costo unitario di training e inferenza, insieme alla diversificazione del silicio (Anthropic-Fractile, Amazon Graviton) e alle nuove generazioni di chip. Il costo per chiamata API che si paga oggi a OpenAI o Anthropic incorpora questa traiettoria;
  • il modello di sviluppo aperto: vedere cinque big che convergono su uno standard aperto è un segnale sul modo in cui l’industria sta evolvendo. Il vendor lock-in sull’infrastruttura si sta riducendo, anche se cambia forma (dal lock-in sui chip al lock-in sul modello).

Riferimenti

OpenAI, paper sul protocollo MRC: cdn.openai.com. Pagina prodotto: openai.com. The Deep View, 6 maggio 2026.