BOLLETTINO OPERATIVO · VEN 12 GIU 2026 · 03:11 CET EN / IT / RSS / NEWSLETTER

Codex CLI di OpenAI: il coding agent che vive nel terminale

Codex CLI è l'agent OpenAI da terminale: legge i file, propone patch, esegue comandi. Tre modalità, GPT-5 di default, open-source Apache 2.0.

Codex CLI è l’agent da terminale che OpenAI ha lanciato ad aprile 2025 e ha continuato a iterare per tutto l’anno. L’idea è semplice: apri una shell, scrivi codex "sistema il bug in auth.py", e l’agent legge i file del repo, propone una patch e la applica con la tua approvazione. Zero editor grafico, zero IDE, solo terminale.

È la risposta diretta di OpenAI a Cursor sul fronte IDE e soprattutto a Claude Code di Anthropic sul fronte CLI. Il codice è open-source sotto Apache 2.0, scritto in un mix di TypeScript e Rust, e vive su GitHub al repo openai/codex.

Cos’è esattamente un terminal coding agent

Il pattern è lo stesso di Claude Code: un loop agentico che alterna lettura del codice, ragionamento e azione. L’agent riceve un’istruzione in linguaggio naturale, decide quali file aprire, quali comandi shell lanciare, quali patch applicare. Non suggerisce completamenti in-line come Copilot: prende in carico un task intero e lo porta a termine, con tappe intermedie.

Rispetto a un’estensione VS Code, il vantaggio è che sta dove sta il codice: dentro il terminale, vicino a git, ai test, al container Docker. Puoi invocarlo da uno script, da un hook, da una pipeline CI.

Le tre modalità operative

Codex CLI espone tre livelli di autonomia, scelti al lancio con un flag:

  • suggest: l’agent propone ogni modifica e ogni comando, tu approvi manualmente. Default prudente.
  • auto-edit: patch applicate in automatico, comandi shell ancora da approvare. Compromesso tipico.
  • full-auto: niente conferme, l’agent lavora da solo dentro una sandbox con rete e filesystem limitati.

La modalità full-auto gira dentro un container isolato e con rollback automatico se qualcosa va storto. È pensata per task lunghi, come refactoring di più file o test generation su un modulo intero, dove stare davanti al terminale a premere Y ogni dieci secondi è improponibile.

Modelli e configurazione

Il modello di default è GPT-5, ma la CLI è configurabile: si possono puntare varianti come GPT-5 mini per task semplici, oppure modelli precedenti della famiglia se servono risposte più rapide. La configurazione sta in un file ~/.codex/config.toml che permette di definire profili diversi per progetti diversi.

Chi ha già un abbonamento ChatGPT Plus o Pro può autenticarsi con quello, senza generare chiavi API separate. È una piccola cosa ma toglie attrito, soprattutto per chi vuole provarlo senza entrare nel dashboard developer.

Approvazioni granulari e sandboxing

Il punto delicato di un agent CLI è quanto rumore ti mette davanti. Codex prova a tenerlo basso con una logica per cui i comandi read-only (cat, ls, grep, test runner) passano senza conferma, mentre tutto ciò che tocca il filesystem in scrittura o la rete richiede un OK esplicito, a meno di non essere in full-auto.

Il sandboxing usa meccanismi diversi a seconda del sistema operativo: Seatbelt su macOS, namespace Linux sotto, e container Docker come fallback più robusto. L’obiettivo dichiarato è che un agent impazzito non possa cancellare la home dell’utente né chiamare endpoint esterni a caso.

Confronto con gli altri CLI agent

Il panorama CLI fine 2025 è affollato. Oltre a Codex ci sono Claude Code, Aider, Cline, Continue, Gemini CLI di Google. Ognuno ha un suo taglio:

  • Claude Code: l’agent più maturo, ecosistema MCP ricco, context window da 200K o 1M, pensato per repo grossi. Il termine di paragone.
  • Aider: storico, open-source puro, funziona con qualsiasi modello via API, ottimo su repo piccoli e medi.
  • Cline: nato come estensione VS Code, più vicino all’IDE, meno CLI in senso stretto.
  • Continue: orientato al team e al self-hosting, più “infrastruttura” che tool quotidiano.
  • Codex CLI: buona integrazione con l’ecosistema OpenAI, UX pulita, sandboxing curato.

Sul piano puro di efficacia, fine 2025 la community è abbastanza d’accordo che Claude Code resta più avanti per task complessi su codebase grandi. Codex ha però il vantaggio di essere gratuito per chi ha già un abbonamento ChatGPT e di stare dietro al marchio OpenAI, il che garantisce distribuzione immediata.

Adozione e limiti

Il pickup nella community dev è stato buono: star su GitHub in rapida crescita dal lancio, integrazioni community con shell come zsh e fish, plugin per hook di git. Chi viene da vibe coding e usa già ChatGPT come tutor lo trova un’estensione naturale del flusso.

I limiti onesti sono due. Primo, su repo molto grossi l’agent tende a perdere contesto più in fretta rispetto a Claude Code, perché la gestione della memoria lunga è meno raffinata. Secondo, la dipendenza da GPT-5 significa che se OpenAI ha un outage o alza i prezzi, il tuo strumento ne risente direttamente. Aider, che è agnostico sul modello, non ha questo problema.

Quando ha senso provarlo

Ha senso in due scenari. Se sei già dentro l’ecosistema OpenAI e vuoi un agent CLI senza pagare una seconda sottoscrizione, è la via diretta. Se stai valutando la categoria “terminal coding agent” in generale e vuoi un secondo punto di vista rispetto a Claude Code, è il confronto più utile da fare, perché sono i due prodotti più comparabili.

Non ha molto senso se stai cercando un tool agnostico sul modello, o se il tuo workflow è già tutto dentro un IDE grafico e il terminale lo apri solo per git. In quel caso un’estensione come Cursor o Cline risolve meglio.

La vera domanda aperta è se il formato CLI diventerà lo standard per l’AI coding o se resterà una nicchia per sviluppatori hardcore. Per ora la direzione sembra chiara: sempre più lavoro di codice si sposta dentro agent che parlano con il filesystem, non dentro completion inline. Quanto ci metterà a diventare normale anche per chi non è hardcore?