Come ottenere il massimo da Codex: approfondimenti dal team ufficiale

@dotey
CINESE2 mesi fa · 21 mag 2026
756K
2.6K
620
70
5.8K

TL;DR

Scopri come far evolvere Codex da assistente alla programmazione ad agente IA completo. Questa guida copre funzionalità avanzate come server MCP, computer-use e memoria condivisa per automatizzare flussi di lavoro complessi e a lungo termine.

Ecco la traduzione in italiano del testo fornito, seguendo tutte le linee guida specificate.


Autore: jason (@jxnlco

Originale:

宝玉 - inline image

jason

@jxnlco

·

20 Maggio

宝玉 - inline image

Articolo

Come ottenere il massimo da Codex

La maggior parte degli sviluppatori usa inizialmente gli agenti di codifica per scrivere codice: ispezionare un repository, creare un diff, eseguire test e aprire una pull request.

Questo rimane il fulcro di Codex. Ma gran parte del lavoro su un...

38

187

1,5K

182K

La maggior parte degli sviluppatori, quando incontra per la prima volta agenti AI per l'editing del codice, di solito li fa fare solo una cosa: scrivere codice. Ad esempio, controllare un repository, generare un diff, eseguire i test e poi inviare una pull request.

Scrivere codice rimane infatti la capacità principale di Codex. Ma se ci pensi, gran parte del lavoro che facciamo su un computer è essenzialmente legato al codice: eseguire comandi nel terminale, navigare sul web, chiamare API, esportare documenti, rispondere a vari eventi o attivare processi di automazione. Quando Codex inizia ad estendersi in queste aree, non sembra più solo un ristretto "assistente di programmazione", ma si evolve in un "lavoratore a tutto tondo" che può aiutarti a gestire ogni tipo di compito informatico.

Le nuove funzionalità di Codex rendono tangibile questa trasformazione. I thread attuali possono ricordare il tuo contesto, chiamare vari strumenti, visualizzare gli artefatti generati e passare senza soluzione di continuità tra diversi prompt, così non devi più "ripresentarti" ogni volta che finisci una chat.

Per spremere completamente il potenziale di Codex, devi combinare queste mosse da esperto:

  • Thread durevoli in grado di preservare la memoria a lungo termine
  • Uso flessibile dell'input vocale, dell'orientamento delle attività e della coda delle attività mantenendo il controllo
  • Estendere la portata di Codex oltre il codice sorgente utilizzando browser, uso del computer, server MCP (Model Context Protocol) (uno standard universale per l'AI per connettersi in modo sicuro a dati e strumenti locali) e vari connettori
  • Lasciarlo continuare a lavorare mentre sei lontano dal computer usando automazioni di thread e Obiettivi
  • Uso competente del pannello laterale per rivedere in qualsiasi momento il codice, i documenti, le slide e altri file generati

Thread durevoli

Thread durevoli: thread Codex a lunga durata che mantengono il contesto del tuo lavoro attraverso usi molteplici.

Fissare i thread è un ottimo modo per tenere queste conversazioni durevoli disponibili in qualsiasi momento. È una manna dal cielo per flussi di lavoro che devono essere avanzati ripetutamente, come ad esempio:

  • Un thread dedicato "Capo di Stato Maggiore" (che ti aiuta a gestire le faccende quotidiane)
  • Un thread specifico per i lanci di prodotto
  • Un thread per la revisione della documentazione
  • Un thread di monitoraggio incentrato su dati esterni

Non sono semplici chat "usa e getta"; sono spazi di lavoro persistenti. Con il tempo, Codex può tornare a queste conversazioni in qualsiasi momento, ricordando le tue decisioni precedenti, le preferenze personali e i progressi attuali. Senza questa funzione, dovresti fornire tutte queste informazioni di base da capo ogni volta.

Fissare le scorciatoie rende tutto ciò estremamente pratico. Premendo Comando-1 fino a Comando-9, puoi saltare istantaneamente in questi thread dedicati salvati per continuare a lavorare.

Input vocale

L'input vocale è utile perché cattura i pensieri più primitivi e grezzi nella tua testa prima che tu debba formularli accuratamente in testo.

Codex ha un input vocale integrato. Questo è particolarmente efficace per quelle idee vaghe che sono "facili da dire ma una scocciatura da scrivere". Ad esempio:

"Ricordo che qualcuno di nome Ben ne ha parlato su Slack.

Ho dimenticato i dettagli.

Vai a cercarlo per me."

Per un agente AI che può cercare, raccogliere contesto e riferirti autonomamente, queste poche frasi sono sufficienti per mettersi al lavoro.

Quando hai un'idea generale in testa che non è ancora completamente formata, passare due o tre minuti a "borbottare" e scaricare tutti i tuoi pensieri in una volta funziona sorprendentemente bene.

La trascrizione delle registrazioni segue la stessa logica. Un verbale di riunione non elaborato o una bozza di piano dettata è spesso più preziosa di un breve riassunto. Perché quei documenti grezzi preservano il tuo tono esitante, i punti enfatizzati e quei lampi di ispirazione incompiuti.

Orientamento e coda

Quando combini l'input vocale con il controllo diretto delle attività in esecuzione, il suo potere si manifesta veramente.

Quando un'attività è in esecuzione, se vuoi:

Orientamento dell'attività: interrompere Codex a metà attività prima che sia finita e dargli una nuova direzione.

Questo è utile quando scopri che l'AI sta andando fuori strada e devi correggerla prima che vada a sbattere contro un muro. Ad esempio, mentre gli fai rivedere un sito web, puoi segnalare cose nel pannello laterale mentre interrompi direttamente il suo lavoro:

  • "Rendi questo un po' più piccolo"
  • "La spaziatura tra questi due elementi non sembra giusta"
  • "Questo testo è scritto male"

Coda delle attività: assegnare a Codex il compito successivo dopo che ha completato il passo corrente.

La coda delle attività è diversa. Non interrompe l'attività in corso ma mette la nuova attività in fondo alla coda. Puoi dirgli:

"Dopo che questo lavoro è finito, invia il link di anteprima al revisore su Slack."

In poche parole, "orientare" significa cambiare ciò che Codex sta facendo in questo momento, mentre "accodare" significa organizzare ciò che dovrebbe fare dopo. Entrambe le funzionalità ti permettono di mantenere un senso di controllo "uomo-macchina uniti" durante l'esecuzione dei compiti.

Strumenti e portata

Una volta che un thread ha memoria continua, la domanda successiva è: cosa può toccare? I tentacoli di Codex possono estendersi verso l'esterno strato dopo strato:

  • $browser: Un browser in-app che funziona nel pannello laterale dove Codex può rivedere e annotare pagine web.
  • @chrome: Può accedere allo stato di accesso del tuo browser per gestire flussi di lavoro basati su Chrome.
  • @computer: Specifico per compiti che possono essere completati solo tramite un'interfaccia utente grafica (GUI) del desktop.

$browser è adatto per revisioni web nel pannello laterale; @chrome è per lavori nel browser che richiedono l'accesso al tuo account; e @computer è usato per compiti che richiedono di cliccare in giro sul desktop del computer.

I server MCP e vari connettori estendono ulteriormente questa capacità in tutto il tuo flusso di lavoro. L'integrazione con Slack, così come vari connettori di strumenti MCP e guide MCP, sono importanti perché molti compiti critici spesso iniziano come un messaggio in chat, un'email in arrivo o un problema di pianificazione prima di diventare codice.

Le Skill permettono di riutilizzare flussi di lavoro ripetitivi. Una volta che un flusso di lavoro si è dimostrato utile, puoi consolidarlo come skill in modo che Codex possa eseguirlo direttamente la prossima volta senza dover reimparare il processo da capo.

Lavora da qualsiasi luogo

Il concetto di lavorare con Codex da qualsiasi luogo rompe completamente la limitazione tradizionale per cui "dobbiamo sederci davanti a un computer per lavorare". Un'attività può iniziare sul tuo Mac pieno di file, autorizzazioni e ambienti locali, e poi continuare a progredire in silenzio quando ti allontani dalla scrivania e la controlli dal telefono.

Questo è molto utile durante i tempi frammentati. Puoi far eseguire a Codex un'attività lunga sul tuo computer e poi allontanarti dalla scrivania per prendere un caffè. Se ha una domanda mentre sei fuori, puoi rispondere direttamente dal telefono, approvare la sua mossa successiva o dargli una nuova direzione prima di tornare al tuo posto. Il tuo ambiente locale rimane lì, lavorando in silenzio, mentre tu ti muovi liberamente.

Automazioni

Le funzionalità di automazione permettono a Codex di lavorare automaticamente secondo una pianificazione da te impostata. Per i compiti che devono iniziare da capo ogni giorno, come generare report giornalieri o controlli di routine del codice sorgente, usa "automazione pianificata". Ma se devi far avanzare il lavoro all'interno di una conversazione con memoria storica, usa "automazione di thread".

Automazione di thread: come un meccanismo di "battito cardiaco" programmato che ritorna periodicamente allo stesso thread di Codex per continuare a lavorare secondo una pianificazione impostata.

Fissare i thread è utile, ma richiede comunque che tu ritorni attivamente ad essi. L'«automazione di thread», invece, può fare il check-in autonomamente ogni pochi minuti o ore fino a quando non viene soddisfatta una certa condizione, e può persino regolare la frequenza del check-in in base alla situazione.

Ad esempio, il tuo thread "Capo di Stato Maggiore" può essere eseguito ogni 30 minuti:

Ogni 30 minuti, controlla la mia Slack e la mia Gmail per eventuali messaggi che necessitano di elaborazione ma a cui non è stato ancora risposto.

Aiutami a dare loro una priorità.

Se qualcuno mi fa una domanda, ricercala il più approfonditamente possibile e aiutami a scrivere una bozza di risposta, ma non inviarla direttamente.

Quando torni al computer, il lavoro più dispendioso in termini di tempo di "raccolta di informazioni di base" è spesso già fatto. Come umano, devi solo prendere la decisione finale di inviarlo.

L'automazione di thread è perfetta anche per gestire i "cicli di feedback". Può osservare silenziosamente i tuoi commenti nelle PR, in Google Docs o su Slack, e automaticamente far avanzare le modifiche di follow-up mentre sei via.

Immagina uno scenario di produzione di animazione: un revisore pubblica un video su Slack. L'automazione di thread può controllare periodicamente l'andamento della discussione; non appena arrivano suggerimenti di modifica, renderizza automaticamente una nuova versione, poi @menziona il revisore nel thread originale e risponde con il nuovo video. Se un'interfaccia di integrazione software non può completare automaticamente il caricamento finale, può persino mobilitare l'"automazione del desktop" per completare l'ultimo passaggio tramite GUI.

Questo ciclo completo chiuso abbraccia Slack per ricevere feedback, il codice sorgente per il rendering e gli strumenti di automazione del desktop per il caricamento finale.

Obiettivi

Quando un compito ha un traguardo chiaro e l'agente AI può lavorare continuamente verso quel fine, il potere degli Obiettivi esplode veramente.

Obiettivi: compiti Codex di più lunga durata con un traguardo chiaro verso cui l'AI continuerà a correre per un periodo di tempo.

Un cattivo obiettivo è impostato così:

Implementa il piano in questo file Markdown.

Un buon obiettivo deve avere un criterio di successo misurabile.

Ad esempio, un ingegnere che vuole migrare uno strumento interno da Python a Rust può impostare la nuova directory, fissare l'obiettivo e tracciare un traguardo chiaro:

Lo sviluppo di questa nuova versione è completo solo quando tutti i test unitari passano.

L'impostazione degli obiettivi consiste essenzialmente nel combinare "esecuzione continua" con un "verificatore". Tu, come umano, definisci il risultato desiderato, le condizioni per fermarsi e i segnali usati per giudicare se Codex si sta avvicinando al traguardo.

I verificatori utili includono:

  • Una serie completa di casi di test
  • Un test di performance di benchmark
  • Un bug riproducibile in modo coerente
  • Una matrice di verifica
  • Un flusso di lavoro end-to-end che deve sempre passare

L'ambizione è importante, ma l'ambizione senza un meccanismo di verifica è solo un augurio.

Il pannello laterale

La funzionalità del pannello laterale tiene i risultati del tuo lavoro generato proprio accanto alla finestra della chat. Non devi più esportare file e passare faticosamente da un software all'altro; puoi revisionarli direttamente lì. I risultati generati potrebbero essere codice, ma potrebbero anche essere slide, PDF, pagine web, fogli di calcolo o qualsiasi altra cosa generata.

È particolarmente indicato per gestire quattro tipi di lavoro:

  1. Ispezionare gli artefatti generati
  2. Annotare le aree che necessitano di modifica
  3. Operare interfacce web
  4. Revisionare le modifiche al codice o ai file

Il pannello laterale permette agli utenti di visualizzare direttamente documenti Markdown, fogli di calcolo, tabelle di dati, documenti semplici e slide. Puoi ispezionare, annotare e modificare file senza interrompere il tuo flusso di lavoro esistente.

宝玉 - inline image

Le tue slide o PDF rimangono aperti proprio accanto alla finestra di dialogo, in attesa della tua revisione e modifica in qualsiasi momento.

宝玉 - inline image

Il browser in-app permette a Codex di ispezionare direttamente le pagine web renderizzate, controllarle e persino rispondere direttamente alle annotazioni che fai sulla pagina. I commenti sulle pagine web o sui file rimangono tutti all'interno di questo ciclo di lavoro, non è più necessario dividerli in compiti di passaggio separati come prima.

La pagina web diventa sia il suo risultato di output che un pannello di controllo che puoi manipolare. Codex può costruire una pagina, aprirla nel pannello laterale, ispezionarla da solo, correggere bug e poi iterare e ottimizzare continuamente la stessa cosa sul posto.

宝玉 - inline image

I seguenti scenari sono particolarmente efficaci con il pannello laterale:

  • Usare un singolo file index.html per display statici leggeri
  • Eseguire Storybook per rivedere i componenti dell'interfaccia utente
  • Usare Remotion Studio per animazioni generate dal codice
  • Presentazioni di slide mostrate nel browser
  • App di dati per flussi di analisi dei dati

Un semplice file index.html può trasformarsi in un'app interattiva divertente senza nemmeno impostare un server. Inoltre, l'automazione dei thread può aggiornare silenziosamente questi file statici nel tempo, così quando torni, trovi sempre l'ultimo progresso che ti aspetta.

Memoria condivisa

Quando quei thread a lunga esecuzione possono rompere i confini di una singola chat e condividere la memoria, la loro utilità fa un salto di qualità.

Memoria condivisa: contesto persistente memorizzato al di fuori di una singola conversazione, permettendo al lavoro futuro di procedere basandosi su informazioni chiare e tracciabili.

Un approccio relativamente sicuro è "ancorare" questi thread persistenti in un vault Obsidian. In poche parole, creare una cartella per memorizzare file di testo semplice. È semplice, comodo per te da visualizzare, modificare e spostare in qualsiasi momento, e dura a lungo. I team possono mettere questa cartella in qualsiasi cloud drive preferiscano, come Git, Dropbox, Google Drive o altri strumenti di sincronizzazione.

Il tuo vault potrebbe assomigliare a questo:

[testo]



vault/

├── TODO.md

├── persone/

├── progetti/

├── agente/

└── note/

Nella directory principale, puoi inserire un file AGENTS.md. Qui puoi impostare le regole per Codex: come dovrebbe aggiornare questo vault quando apprende cose nuove su persone, progetti, decisioni e cose da fare.

Non copiare ciecamente una struttura di vault specifica. Quello che devi fare è "insegnare" al tuo agente AI: dove deve andare il contesto persistente, quale contesto deve essere conservato e quando non pasticciare con i file.

Una guida pratica di AGENTS.md potrebbe dire:

  • Tratta ~/vault come la tua area di memoria di lavoro a lungo termine.
  • Cerca di tenere le note organizzate; non lasciare che registrazioni frammentate vadano dappertutto.
  • Categorizza accuratamente cose da fare, persone, progetti, riepiloghi giornalieri e bozze.
  • Salva correttamente le decisioni prese, i blocchi incontrati, i responsabili, le date e i link utili.
  • Se non ci sono nuovi progressi sostanziali, non modificare a caso i file nel vault.

I codebase sono per memorizzare il codice. Questo vault è per memorizzare il contesto in evoluzione: chi è coinvolto, cosa è stato cambiato, dove sono le cose bloccate, chi segue dopo e quei dettagli che andrebbero completamente persi se interrotti tra due chat.

Il contesto importante non dovrebbe mai essere bloccato esclusivamente all'interno dei record testuali di una singola chat. Scrivilo e mettilo dove il prossimo thread possa prenderlo immediatamente.

Codex stesso fornisce anche funzionalità di memoria ufficiali in Impostazioni > Personalizzazione > Memoria. Sono come bloc-notes locali integrati usati per ricordare le tue preferenze personali, i flussi di lavoro comuni e gli intoppi frequenti. Tuttavia, questa funzionalità è pensata per integrare il contesto che scrivi chiaramente, non per sostituirlo. Il componente di memoria Chronicle segue la stessa logica, aiutando Codex a estrarre e costruire memoria da ciò che è accaduto di recente sul tuo schermo.

Dal codice verso l'esterno

Sebbene Codex sia nato con la scrittura di codice come suo mestiere principale, ora molti compiti periferici che circondano il codice possono essere gestiti all'interno di questo stesso sistema: che si tratti di server MCP, interfacce web, controllo del desktop, automazione di thread o file che possono essere revisionati direttamente nel pannello laterale.

Questo cambia completamente il modo in cui lo controlliamo. L'"orientamento dell'attività" può interrompere le sue azioni a metà; la "coda delle attività" può aiutarlo a organizzare i passaggi successivi; l'"automazione di thread" permette al sistema di continuare a funzionare quando non ci sei; e la "definizione degli obiettivi" traccia un traguardo chiaro, facendo sapere a Codex dove continuare a correre.

Il Codex di oggi può già gestire un flusso di lavoro completo: dall'ascolto delle istruzioni all'esecuzione dei compiti, fino alla revisione finale dei file. Anche se questi compiti hanno da tempo superato l'ambito del codice sorgente, li gestisce comunque con facilità.

Save to YouMind

Use YouMind to read viral articles deeply

Save the source, ask focused questions, summarize the argument, and turn a viral article into reusable notes in one AI workspace.

Explore YouMind
Per i creator

Trasforma il tuo Markdown in un articolo 𝕏 pulito

Quando pubblichi i tuoi testi lunghi, formattare immagini, tabelle e blocchi di codice per 𝕏 è una seccatura. YouMind trasforma un'intera bozza Markdown in un articolo 𝕏 pulito e pronto da pubblicare.

Prova Markdown verso 𝕏

Altri pattern da decodificare

Articoli virali recenti

Esplora altri articoli virali