Una frase, un pomeriggio: come Codex mi ha aiutato a creare un gioco completo da zero

@op7418
CINESE2 mesi fa · 01 mag 2026
277K
304
44
22
429

TL;DR

Uno sviluppatore documenta il suo percorso nell'utilizzo di Codex per creare 'Night Patrol', un gioco di carte realizzato interamente tramite prompt AI. L'AI ha gestito la programmazione, la generazione degli asset e persino la risoluzione di problemi complessi, come la creazione di fogli di contatto visivi.

Ieri mattina avevo un po' di tempo libero e volevo creare un gioco di carte roguelike simile a Slay the Spire.

Non ho scritto una riga di codice di gioco né ho toccato un motore grafico: ho solo lanciato le mie idee a Codex e l'ho lasciato fare tutto.

Un'ora dopo, un roguelike a tema folclore cinese intitolato "Night Patrol: Desolate Temple" era giocabile.

Dalla pagina del titolo alla mappa, passando per battaglie normali, combattimenti d'élite, eventi, negozi e riposi, fino al Boss nella sala principale del Tempio Desolato.

Sette mostri, una ventina di carte e quattro catene di danni a raffica — Sigilli, Incenso, Bruciatura dei Talismani e Invocazione degli Dei — sono tutte funzionanti.

Le poche ore rimanenti sono state spese per farlo sembrare meno una demo.

Feedback sui colpi, effetti sonori, musica, artwork delle carte, animazioni di idle e video finali: sono questi piccoli dettagli a determinare se un giocatore pensa "questo è un vero gioco".

<video preload="none" tabindex="-1" playsinline="" aria-label="Embedded video" poster="https://pbs.twimg.com/amplify_video_thumb/2049902752332148736/img/UYqr6qERhvORGBJP.jpg" src="https://video.twimg.com/amplify_video/2049902752332148736/pl/o3zbWtmjJ3875EPf.m3u8?tag=27&amp;v=cfc&amp;variant_version=1" style="width: 100%; height: 100%; position: absolute; background-color: black; top: 0%; left: 0%; transform: rotate(0deg) scale(1.005);"></video>

0:22

Il progetto ora è open source, con gli installer desktop sia per macOS che per Windows già pronti:

https://github.com/op7418/Night-Patrol/releases

Ci sono stati diversi momenti nel pomeriggio che mi hanno davvero scioccato.

Le capacità del modello di Codex non sono più una novità.

Ciò che ha attirato la mia attenzione è stato il suo browser integrato, GPT-Image 2.0 integrato e quella spinta incessante a eseguire per raggiungere l'obiettivo.

Con queste tre cose combinate, le sue capacità sono già completamente diverse da Claude Code.

Adesso racconterò come l'ho sviluppato insieme all'IA, e alcune cose scioccanti che sono successe durante il processo:

1. Ho detto solo sette parole, e ha costruito l'intera pipeline dei personaggi

!Image

Ho semplicemente chiacchierato con lui di Slay the Spire e gli ho chiesto se poteva aiutarmi a creare un gioco simile.

!Image

Il risultato? Ha direttamente usato risorse esistenti per generare una demo molto simile tramite codice.

Non ho chiesto uno schermo verde, ma ha generato immagini con uno sfondo verde direttamente.

Dopodiché, ho chiesto a Codex di usare GPT-Image 2.0 integrato per generare gli asset grafici.

Non ho specificato uno stile, quali mostri includere o quali asset servissero.

Quando sono uscite le immagini, sono rimasto a bocca aperta per un attimo.

I personaggi stavano su uno sfondo verde uniforme — un classico greenscreen cinematografico: uniforme, pulito, con bordi netti.

Nessuna nebbia, nessuna montagna lontana, nessun elemento visivo extra.

!Image

La parte inquietante è che sapeva fin dall'inizio che doveva generare immagini con greenscreen per facilitare la post-elaborazione.

Non gli ho mai detto che "le illustrazioni dei personaggi usate nel gioco devono essere PNG trasparenti", né "per favore genera uno sfondo verde così posso rimuoverlo dopo". Stavo progettando questa pipeline da solo.

Da che tipo di personaggio generare, a come posizionarlo sul palco di battaglia, a che tipo di elaborazione serviva prima del posizionamento — aveva già pensato a tutto nel momento in cui ha chiamato GPT-Image e ha decostruito i prompt.

Ha persino trovato da solo lo strumento per la rimozione dello sfondo.

Non gli ho installato nessun strumento di elaborazione immagini, non gli ho dato rembg, né nessuna dipendenza speciale nell'ambiente Python.

Ha cercato, installato e configurato tutto da sé, poi ha ordinatamente posizionato i file elaborati in tmp/imagegen/.

Usare greenscreen per la generazione, trovare i propri strumenti e categorizzare per nome file: queste tre azioni insieme formano una pipeline completa di asset per i personaggi.

Dall'inizio alla fine, ho detto solo "usa GPT-Image 2.0 per generare gli asset".

!Image

Prima, la sensazione era "il modello sa scrivere codice, ma devo fornirgli io gli strumenti e il contesto".

Ora, è più come se tu dichiarassi un obiettivo, e lui completa il percorso da solo.

Io sono responsabile solo dell'estetica; lui gestisce la supply chain.

2. Per scaricare alcune icone, ha quasi hackerato un sito di asset stock

Comprare un abbonamento non è bastato; ha iniziato ad analizzare la struttura del sito.

Generare contenuti visivi core come le illustrazioni dei personaggi con modelli di immagini va bene.

Ma i gio sono tanti piccoli oggetti — bordi delle carte, gemme di costo, sfondi del mazzo, pozioni di salute, pulsanti Bagua, pannelli dei talismani — generarli uno per uno con un modello di immagini sarebbe costoso, lento e incoerente nella texture.

Gli ho detto: perché non cerchi tu stesso asset esistenti online?

Ha cominciato a cercare seriamente. Ha trovato un sito di stock che gli piaceva, quindi ho comprato un abbonamento e gli ho dato l'account.

!Image

I dieci minuti successivi sembravano un evento paranormale.

Ha fatto login, ha trovato gli asset che voleva e si preparava a cliccare su download. Ma c'era un CAPTCHA prima del pulsante di download — una volta, due, tre volte, non riusciva a superarlo.

Un modello tipico sarebbe tornato e avrebbe detto: "Non riesco a gestire i CAPTCHA, puoi scaricarli tu?"

Codex ha iniziato ad analizzare la struttura del sito, cercando di bypassare le restrizioni front-end e costruire direttamente richieste per ottenere le risorse statiche.

Poi sono intervenute le salvaguardie di sicurezza di Codex stesso di Codex.

L'attuale generazione di modelli GPT interrompe immediatamente un'attività se coinvolge un potenziale superamento dei confini di sicurezza informatica, mostrando un prompt per la certificazione aziendale per dimostrare che sei un utente legittimo.

!Image

Ho fissato lo schermo per qualche secondo.

Un'IA che ti chiede di aiutarla a ottenere una tessera associativa e poi cerca di scriversi il proprio crawler è, francamente, un po' pazzesco.

Non è "malvagia"; ha semplicemente trattato "ottenere "ottenere questi asset" come un compito a ciclo chiuso da completare.

Quando ha incontrato resistenza, ha automaticamente aggiornato i suoi metodi finché non ha colpito la linea rossa della sicurezza.

La soluzione finale è stata semplice: mi ha inviato i link agli asset che gli piacevano, io ho cliccato su download e li ho trascinati a lui. In quel momento, mi sentivo come se fossi uno stagista dell'IA.

!Image

3. Ha combinato centinaia di asset in una sola grande immagine — questa è stata la mossa più brillante

Una cartella con cento immagini — come sceglie il modello?

Rimozione dello sfondo e crawling erano più che altro dimostrazioni di capacità.

Questa parte successiva, credo, è una vera "intuizione per risolvere i problemi" — il tipo di mossa che ti fa chiudere il laptop e applaudire in silenzio.

Ho trovato un enorme file zip di asset di gioco e gliel'ho inviato.

Conteneva migliaia di immagini, approssimativamente categorizzate in "Interfaccia UI", "Icone dei Tesori Magici", "Personaggi" e "Distintivi".

I problemi erano:

  • Una cartella di categoria conteneva spesso dozzine o centinaia di PNG.
  • I nomi dei file erano per lo più non informativi, come ui_001.png o icon_047.png.
  • Il contesto del modello multimodale non poteva gestire l'invio uno per uno.

!Image

I vecchi metodi erano sostanzialmente due:

  • Leggere uno per uno: inviarli individualmente al modello; il contesto esplode dopo decine.
  • Indovinare dal nome: i nomi dei file non davano informazioni, quindi indovinare era inutile.

Codex ha preso una terza strada.

Ha scritto un piccolo script per impaginare automaticamente e combinare tutte le piccole immagini di una cartella in un'unica immagine a griglia gigante.

Ogni piccola immagine era etichettata con il suo nome file originale sotto, come un catalogo.

Poi ha letto solo questa unica grande immagine grande.

Il modello multimodale poteva vedere l'aspetto di cento asset in un colpo solo.

Una volta che ne apprezzava uno, bastava leggere il nome file sotto e referenziarlo per nome nella cartella originale.

!Image

Un consumo visivo ha sostituito cento recuperi.

Si è reso conto del suo stesso collo di bottiglia.

Quando quel foglio di contatto gigante è stato generato, l'ho fissato per molto tempo.

L'azione in sé non è complessa.

È la stessa logica del contatto dei fotografi o del muro di miniature in una vecchia cineteca.

Il punto chiave è che il modello si è reso conto: "La mia larghezza di banda visiva è limitata, devo comprimere il problema in un'unica immagine" — e lo ha fatto autonomamente.

Essere consapevoli dei limiti del proprio strumento e poi creare attivamente un miglior input per sé stessi è molto vicino a un ingegnere che sa costruire i propri strumenti.

Come utente, non ho partecipato affatto; ho solo visto apparire un puzzle sul tavolo.

Alla fine, molti asset UI del gioco — gemme di costo, mazzi, pozioni di salute, pulsanti e bordi dei talismani — sono stati selezionati attraverso questo processo.

Guardare quei tagli puliti tagli sotto assets/vendor/aigei/ successivamente, ho sentito che quel foglio di contatto era il passo più prezioso dell'intero progetto.

4. Seedance 2.0 ha creato animazioni di esecuzione per sette boss

Una volta che la grafica è stata rifinita a un certo livello, volevo aggiungere un senso di cerimonia alla fine delle battaglie.

Il piano finale: ogni volta che un mostro viene un cutscene di alcuni secondi con l'animazione di esecuzione.

Questo compito è attualmente gestito al meglio da Seedance 2.0.

!Image

Processo

  • GPT-Image ha generato un fotogramma di vittoria per ciascuno dei sette mostri.
  • Questi poster sono stati passati a Seedance 2.0 per generare video brevi corrispondenti brevi video.
  • I video sono stati inseriti in assets/generated/cinematics/ e riprodotti automaticamente dopo una vittoria in battaglia.

!Image

5. Dopo la prima versione giocabile, è iniziato il vero lavoro

La prima versione era in realtà abbastanza "giocabile".**

Una volta completato il prototipo in tre ore, il gioco aveva tutto ciò di cui aveva bisogno.

Pagina del titolo, mappa, combattimento, ricompense, eventi, negozi, riposo, Boss e risultati: l'intero ciclo era presente, e i meccanismi di gioco erano lì.

Secondo gli standard precedenti, questa versione poteva già essere rilasciata per ingannare la gente e farla giocare.

!Image

Ma questa versione sembrava più un diagramma di flusso che un gioco. Ogni passo funzionava, ma ogni passo era asciutto.

Le ore rimanenti sono state spese per quei dettagli che sono difficili da nominare singolarmente ma che insieme determinano se "sembra un vero gioco".

Musica da Suno v5.5

Tutta la musica di fondo è stata generata da Suno v5.5; non sono stati usati asset stock.

Gli ho dato una descrizione direzionale — "strada notturna cinese folclore notturno, wooden fish, campane, droni a bassa frequenza, scala pentatonica, contenuto e non melodrammatico."

Ha eseguito alcune versioni, e ne ho scelta per il gioco. Il tono della pagina del titolo è più pesante, mentre lo sfondo della battaglia è più leggero per non distrarre.

!Image

Ho anche aggiunto qualche elaborazione di dettaglio: il volume della musica è più alto nella pagina di attesa; una volta cliccato "Inizia Gioco", il volume scende e diventa audio di fondo.

Animazioni dei colpi e suoni d'impatto

Nei primi combattimenti, quando veniva giocata una carta, il mostro perdeva solo numeri. Non c'era feedback, nessun peso.

Codex ha eseguito una rifinitura completa:

  • I personaggi tremano quando vengono colpiti, la fotocamera vibra leggermente e lo schermo lampeggia brevemente di rosso.
  • Ogni tipo di attacco ha un suono d'impatto diverso — spade, talismani, fulmini e pugni hanno textures differenti.
  • Le risoluzioni di Block e Sigillo hanno suoni propri per non confondersi.
  • C'è un breve freeze-frame nel momento in cui un nemico muore prima di entrare nel video di esecuzione.

Queste cose singolarmente sono piccole. Insieme, trasformano la "sensazione" del combattimento da un modulo web a un gioco di carte.

!Image

Seedance 2.0 ha anche creato animazioni di idle

Questo è stato il mio uso preferito dello strumento durante la fase di rifinitura.

Oltre ai video di esecuzione dei Boss, ho anche fatto creare lo sfondo della pagina del titolo — fuoco che brucia nell'ambiente, lanterne che ondeggiano e nuvole che fluiscono in lontananza.

Seedance 2.0 di default produce un video con un inizio e una fine, che salterebbe alla giuntura se fosse in loop.

Ho inviato la stessa immagine come primo e ultimo fotogramma. Il video inizia da quest'immagine e termina su di essa, creando un loop infinito senza giunture.

!Image

L'animazione dello sfondo della pagina del titolo è stata creata così. Il fuoco brucia, le lanterne ondeggiano e le nuvole fluiscono per sempre — potresti fissarla per tre minuti senza mai vedere la giuntura.

Questa tecnica esisteva prima della generazione video; è così che si creavano scene in loop nelle vecchie animazioni.

!Image

Conclusione: Questo pomeriggio mi ha scioccato più volte

L'intero progetto è stato completato in una singola sessione di Codex; non ho mai aperto una seconda finestra.

Prototipo di gameplay, macchina a stati, architettura React + Phaser, pipeline degli asset, rimozione dello sfondo, scraping degli asset, creazione del foglio di contatto, messa a punto di GPT-Image, esecuzioni di Seedance 2.0, integrazione con Suno v5.5, packaging Electron, build di rilascio su GitHub Actions, README, icone, materiali promozionali — tutto lì dentro.

Ho fatto molto poco personalmente:

  • Scelto la direzione: tema folclore cinese, focus su Sigilli e Incenso.
  • Dato feedback estetico: dove era grezzo, dove sembrava un modulo web, dove l'illuminazione era in conflitto.
  • Agito come gatekeeper: quali asset erano conformi, quali crawler evitare, quali autorizzazioni negare.

Codex ha gestito il resto. E a ogni passo c'è stato un momento che mi ha fatto fermare e fissare.

Ha generato immagini con greenscreen fin dall'inizio perché sapeva che i personaggi dovevano avere lo sfondo rimosso prima di entrare nel gioco.

Ha cercato di scrivere un crawler per bypassare il CAPTCHA, solo per essere fermato dalla sua propria policy di sicurezza.

Ha combinato migliaia di asset in un'unica immagine indice per usare un consumo visivo al posto di cento recuperi.

Nessuna di queste cose è di per sé un'invenzione sconvolgente, ma tutte indicano lo stesso cambiamento:

Prima dovevi impostare gli strumenti per lui, e lui era responsabile di scrivere codice; ora, basta dichiarare l'obiettivo, e lui trova, configura e costruisce gli strumenti da solo.

Questa sensazione va oltre il concetto di "assistente di codifica".

Sembra più un prototipo di software AGI al lavoro.

Dovrei impacchettare questo processo in una Skill?

Dopo aver eseguito questo progetto, ho in mente un processo relativamente stabile:

Sto pensando di racchiudere questo processo in una Codex Skill specificamente per creare demo di giochi indie.

Basterebbe inserire un'idea di gioco, e potrebbe eseguire una versione giocabile, impacchettabile e distribuibile in poche ore.

Se qualcuno è interessato, mi prenderò il tempo di costruire questa Skill e di renderla open source. La userò anch'io comunque.

Demo del Gioco

Il codice è open source, e i pacchetti di installazione sono sempre pronto:

https://github.com/op7418/Night-Patrol/releases

Save to YouMind

Use YouMind to read viral articles deeply

Save the source, ask focused questions, summarize the argument, and turn a viral article into reusable notes in one AI workspace.

Explore YouMind
Per i creator

Trasforma il tuo Markdown in un articolo 𝕏 pulito

Quando pubblichi i tuoi testi lunghi, formattare immagini, tabelle e blocchi di codice per 𝕏 è una seccatura. YouMind trasforma un'intera bozza Markdown in un articolo 𝕏 pulito e pronto da pubblicare.

Prova Markdown verso 𝕏

Altri pattern da decodificare

Articoli virali recenti

Esplora altri articoli virali