Una frase, una tarde: cómo Codex me ayudó a crear un juego completo desde cero

@op7418
CHINOhace 2 meses · 01 may 2026
277K
304
44
22
429

TL;DR

Un desarrollador documenta su experiencia utilizando Codex para crear 'Night Patrol', un juego de cartas desarrollado íntegramente mediante prompts de IA. La IA se encargó de la programación, la generación de recursos e incluso de la resolución de problemas complejos, como la creación de hojas de contacto visuales.

Ayer por la mañana, tuve algo de tiempo libre y quería hacer un juego de cartas tipo roguelike similar a Slay the Spire.

No escribí ni una línea de código del juego ni toqué un motor; simplemente lancé mis ideas a Codex y dejé que manejara el resto.

Una hora después, un roguelike con temática de folklore chino titulado "Night Patrol: Desolate Temple" era jugable.

Desde la página del título hasta el mapa, pasando por batallas normales, élites, eventos, tiendas y descansos, hasta llegar al Jefe en el salón principal del Templo Desolado.

Siete monstruos, unas veinte cartas y cartas y cuatro cadenas de daño explosivo —Sellos, Incienso, Quema de Talismanes e Invocación de Dioses— están todas funcionales.

Las pocas horas restantes se dedicaron a hacer que se viera menos como un demo.

Retroalimentación de impacto, efectos de sonido, música, arte de cartas, animaciones en reposo y videos de finalización — estos pequeños detalles determinan si un jugador cree que "esto es un juego real".

<video preload="none" tabindex="-1" playsinline="" aria-label="Video incrustado" poster="https://pbs.twimg.com/amplify_video_thumb/2049902752332148736/img/UYqr6qERhvORGBJP.jpg" src="https://video.twimg.com/amplify_video/2049902752332148736/pl/o3zbWtmjJ3875EPf.m3u8?tag=27&amp;v=cfc&amp;variant_version=1" style="width: 100%; height: 100%; position: absolute; background-color: black; top: 0%; left: 0%; transform: rotate(0deg) scale(1.005);"></video>

0:22

El proyecto ahora es de código abierto, con instaladores de escritorio tanto para macOS como para Windows listos:

https://github.com/op7418/Night-Patrol/releases

Hubo varios momentos a lo largo de la tarde que realmente me impactaron.

Las capacidades del modelo de Codex ya no son noticia.

Lo que me llamó la atención fue su navegador integrado, GPT-Image 2.0 integrado, y ese impulso implacable de ejecución para lograr el objetivo.

Con estas tres cosas combinadas, su capacidad ya es completamente diferente de Claude Code.

A continuación, hablaré sobre cómo lo desarrollé junto con la IA, y algunas cosas impactantes que ocurrieron durante el proceso:

1. Solo dije siete palabras, y construyó todo el pipeline de personajes

!Imagen

Solo charlé con él sobre Slay the Spire y le preguné si podía ayudarme a hacer un juego similar.

!Imagen

Como resultado, usó directamente los recursos existentes para generar un demo muy similar mediante código.

No pedí una pantalla verde, pero generó imágenes con un fondo de pantalla verde directamente.

Después, le pedí a Codex que usara el GPT-Image 2.0 integrado para generar los activos de imagen.

No especifiqué un estilo, qué monstruos incluir, ni qué activos se necesitaban.

Cuando salieron las imágenes, me quedé atónito por un momento.

Los personajes estaban sobre un fondo verde sólido —una pantalla verde estándar de cine y televisión: uniforme, limpia, con bordes claros.

Sin niebla, sin montañas lejanas, sin elementos visuales adicionales.

!Imagen

La parte aterradora es que sabía desde el principio generar imágenes con pantalla verde para facilitar el procesamiento posterior.

Nunca le dije que 'las ilustraciones de personajes usadas en el juego deben ser PNG transparentes', ni dije 'por favor genera un fondo de pantalla verde para que lo pueda quitar después'. Estaba planeando este pipeline por sí mismo.

Desde qué tipo de personaje generar, hasta cómo colocarlos en el escenario de batalla, hasta qué procesamiento era necesario antes de la colocación — lo había pensado todo en el momento en que llamó a GPT-Image e hizo ingeniería inversa de los prompts.

Incluso encontró la herramienta de eliminación de fondo por sí mismo.

No instalé ninguna herramienta de procesamiento de imágenes para él, no le di rembg, ni ninguna dependencia especial en el entorno de Python.

Buscó, instaló y configuró todo por sí mismo, luego colocó limpiamente los archivos procesados en tmp/imagegen/.

Usar pantallas verdes para la generación, encontrar sus propias herramientas y categorizar por nombre de archivo — estas tres acciones juntas formaron un pipeline completo de activos de personajes.

De principio a fin, solo dije las palabras 'usa GPT-Image 2.0 para generar activos'.

!Imagen

Anteriormente, la sensación era 'el modelo puede escribir código, pero yo tengo que proporcionar las herramientas y el contexto'.

Ahora, es más como que tú estableces un objetivo, y él completa el camino por sí mismo.

Yo solo soy responsable de la estética; él maneja la cadena de suministro.

2. Para descargar unos pocos íconos, casi hackeó un sitio de activos de stock

Comprar una membresía no fue suficiente; empezó a analizar la estructura del sitio web.

Generar imágenes centrales como el arte de personajes con modelos de imagen está bien.

Pero los juegos tienen muchos elementos pequeños —bordes de cartas, gemas de costo, fondos de mazo, pociones de salud, botones Bagua, paneles de talismán— generarlos uno por uno con un modelo de imagen sería caro, lento y con textura inconsistente.

Le dije, ¿por qué no buscas activos existentes en línea tú mismo?

Comenzó a buscar en serio. Encontró un sitio de stock que le gustó, así que compré una membresía y le di la cuenta.

!Imagen

Los siguientes diez minutos fueron como un evento paranormal.

Inició sesión, encontró los activos que quería y se preparó para hacer clic en descargar. Pero había un CAPTCHA antes del botón de descarga — una vez, dos veces, tres veces, no pudo pasarlo.

Un modelo típico volvería y diría 'No puedo manejar CAPTCHAs, ¿puedes ayudarme a descargarlos?'

Codex comenzó a analizar la estructura del sitio web, intentando eludir las restricciones de clic del frontend y construir directamente solicitudes para obtener recursos estáticos.

Luego intervinieron las propias barreras de seguridad de Codex.

La generación actual de modelos GPT terminará inmediatamente una tarea si implica un posible cruce de límites de ciberseguridad, mostrando un mensaje de certificación empresarial para demostrar que eres un usuario legal.

!Imagen

Me quedé mirando la pantalla por unos segundos.

Una IA que te pide que la ayudes a obtener una tarjeta de membresía y luego intenta escribir su propio rastreador es, francamente, un poco loca.

No es 'malvada'; simplemente trató 'obtener estos activos' como una tarea de ciclo cerrado que debe completarse.

Cuando encontró resistencia, automáticamente actualizaba sus métodos hasta chocar con la línea roja de seguridad.

La solución final fue simple: me envió los enlaces a los activos que le gustaban, y yo hice clic en descargar y los arrastré hacia él. En ese momento, sentí que era un becario de la IA.

!Imagen

3. Combinó cientos de activos en una sola imagen grande — este fue el movimiento más brillante

Una carpeta con cien imágenes — ¿cómo elige el modelo?

La eliminación de fondo y el rastreo eran más sobre demonstraciones de capacidad.

Esta siguiente parte, creo, es una verdadera 'perspicacia para resolver problemas' — el tipo de movimiento que te hace cerrar tu portátil y aplaudir en silencio.

Encontré un enorme archivo zip de activos de juego y lo envié.

Contenía miles de imágenes, aproximadamente categorizadas en 'Interfaz de UI', 'Íconos de Tesoros Mágicos', 'Personajes' e 'Insignias'.

Los problemas eran:

  • Una carpeta de categoría a menudo tenía docenas o cientos de PNGs.
  • Los nombres de archivo eran en su mayoría poco informativos, como ui_001.png o icon_047.png.
  • El contexto del modelo multimodal no podía manejarlos alimentándolos uno por uno.

!Imagen

Las formas antiguas eran básicamente dos:

  • Leer uno por uno: enviarlos al modelo individualmente; el contexto explota después de docenas.
  • Adivinar por nombre: los nombres de archivo no tenían información, así que adivinar era inútil.

Codex tomó un tercer camino.

Escribió un pequeño script para componer y combinar automáticamente todas las imágenes pequeñas en una carpeta en una imagen de cuadrícula gigante.

Cada imagen pequeña estaba etiquetada con su nombre de archivo original debajo, como un catálogo.

Luego solo leyó esta única imagen grande.

El modelo multimodal podía ver la apariencia de cien activos de un vistazo.

Una vez que le gustaba uno, simplemente leía el nombre de archivo debajo y lo referenciaba por nombre en la carpeta original.

!Imagen

Un consumo visual reemplazó cien recuperaciones.

Se dio cuenta de su propio cuello de botella.

Cuando se generó esa enorme hoja de contactos, me quedé mirándola por un largo rato.

La acción en sí no es compleja.

Es la misma lógica que la hoja de contactos de un fotógrafo o la pared de miniaturas de una antigua filmoteca.

La clave es que el modelo se dio cuenta, 'Mi ancho de banda visual es limitado, necesito comprimir el problema en una sola imagen' — y lo hizo de forma independiente.

Ser consciente de las limitaciones de su herramienta y luego crear activamente una mejor entrada para sí mismo está muy cerca de ser un ingeniero que puede construir sus propias herramientas.

Como usuario, no participé en absoluto; solo vi aparecer un rompecabez sobre la mesa.

Al final, muchos activos de UI en el juego — gemas de costo, mazos, pociones de salud, botones y bordes de talismán — fueron seleccionados a través de este proceso.

Al ver esos recortes limpios en assets/vendor/aigei/ más tarde, sentí que esa hoja de contactos fue el paso más valioso de todo el proyecto.

4. Seedance 2.0 creó animaciones de ejecución para siete jefes

Una vez que los visuales estuvieron pulidos a un cierto nivel, quise agregar un sentido de ceremonia al final de las batallas.

El plan final: cada vez que un monstruo es derrotado, se reproduce una escena con unos segundos de animación de ejecución.

Esta tarea actualmente es mejor manejada por Seedance 2.0.

!Imagen

Proceso

  • GPT-Image generó un fotograma congelado de victoria para cada uno de cada uno de los siete monstruos.
  • Estos pósters se alimentaron a Seedance 2.0 para generar videos cortos correspondientes.
  • Los videos se colocaron en assets/generated/cinematics/ y se reproducen automáticamente después de una victoria en batalla.

!Imagen

5. Después de la primera versión jugable, comenzó el trabajo real

La primera versión era realmente lo suficientemente 'jugable'.

Cuando el prototipo estuvo terminado en tres horas, el juego tenía todo lo que necesitaba.

Página de título, mapa, combate, recompensas, eventos, tiendas, descansos, Jefe y resultados — el ciclo completo estaba ahí, y los ganchos de jugabilidad estaban presentes.

Según estándares anteriores, esta versión ya podría lanzarse para engañar a la gente y que jueguen.

!Imagen

Pero esta versión se sentía más como un diagrama de flujo que como un juego. Cada paso funcionaba, pero cada paso era seco.

Las horas restantes se dedicaron a esos detalles que son difíciles de nombrar individualmente pero que juntos determinan si 'esto se siente como un juego real'.

, de Suno v5.5

Toda la música de fondo fue generada por Suno v5.5; no se usaron activos de stock.

Le di una descripción direccional — 'camino nocturno de folklore chino, pez de madera, campanas, zumbido de baja frecuencia, escala pentatónica, contenido y no melodramático'.

Ejecutó algunas versiones, y elegí una para el juego. El tono de la página del título es más pesado, mientras que el de batalla es más ligero para no distraer.

!Imagen

También agregé algo de procesamiento de detalle: el volumen de la música es más alto en la página de espera; una vez que se hace clic en 'Iniciar Juego', el volumen baja y se convierte en audio de fondo.

Animaciones de golpe y sonidos de impacto

En el combate inicial, cuando se jugaba una carta, el monstruo solo perdía números. No había retroalimentación, sin peso.

Codex realizó un pulido completo:

  • Los personajes se sacuden al ser golpeados, la cámara vibra ligeramente y la pantalla parpadea brevemente en rojo.
  • Cada tipo de ataque tiene un sonido de impacto diferente — espadas, talismanes, rayos y puñetazos tienen texturas diferentes.
  • Las resoluciones de Bloqueo y Sellos tienen sus propios sonidos para no mezclarse.
  • Hay un breve fotograma congelado en el momento en que un enemigo muere antes de entrar al video de ejecución.

Estas cosas son pequeñas individualmente. Juntas, transforman la 'sensación' del combate de un formulario web a un juego de cartas.

!Imagen

Seedance 2.0 también creó animaciones en reposo

Este paso fue mi uso favorito de la herramienta durante la fase de pulido.

Además de los videos de ejecución del Jefe, también hice que creara el fondo de la página del título — fuego ardiendo en el entorno, linternas balanceándose y nubes fluyendo en la distancia.

Seedance 2.0 por defecto produce un video con un principio y un final, que saltaría en la costura si se repitiera.

Envié la misma imagen como primer y último fotograma. El video comienza desde esta imagen y regresa a ella, creando un bucle infinito sin costuras.

!Imagen

La animación de fondo de la página del título se creó de esta manera. El fuego arde, las linternas se balancean y las nubes fluyen para siempre — podrías mirarlo por tres minutos y nunca ver la costura.

Esta técnica existía antes de la generación de video; así es como se hacían las escenas en bucle en animaciones antiguas.

!Imagen

Conclusión: Esta tarde me impactó varias veces

Todo este proyecto se completó en una sola sesión de Codex; nunca abrí una segunda ventana.

Prototipo de jugabilidad, máquina de estados, arquitectura React + Phaser, pipeline de activos, eliminación de fondo, raspado de activos, creación de hoja de contactos, ajuste de GPT-Image, ejecuciones de Seedance 2.0, integración de Suno v5.5, empaquetado de Electron, builds de Release de GitHub Actions, README, íconos, materiales promocionales — todo ahí.

Yo hice muy poco por mi cuenta:

  • Elegí la dirección: tema de folklore chino, enfoque en Sellos e Incienso.
  • Di retroalimentación estética: dónde era tosco, dónde parecía un formulario web, dónde chocaba la iluminación.
  • Actué como guardián: qué activos eran conformes, qué rastreadores evitar, qué permisos denegar.

Codex manejó el resto. Y cada paso tuvo un momento que me hizo pausar y mirar.

Generó imágenes de pantalla verde desde el principio porque sabía que los personajes necesitaban que se les quitara el fondo antes de entrar al juego.

Escribir un rastreador para eludir CAPTCHAs, solo para ser detenido por su propia política de seguridad.

Combinó miles de activos en una imagen de índice gigante para poder usar un consumo visual para reemplazar cien recuperaciones.

Ninguna de estas cosas son inventos revolucionarios por sí mismas, pero todas apuntan al mismo cambio:

Anteriormente, tenías que configurar las herramientas para él, y él era responsable de escribir codigo; ahora, solo estableces el objetivo, y él encuentra, configura y construye las herramientas por sí mismo.

Esta sensación ha ido más allá del ámbito de un 'asistente de codificación'.

Se siente más como un prototipo de software de AGI en acción.

¿Debería empaquetar este proceso en una Skill?

Después de ejecutar este proyecto, tengo un proceso relativamente estable en mente:

Estoy pensando en si envolver este proceso en una Skill de Codex específicamente para hacer demos de juegos indie.

Solo dejarías una idea de jugabilidad, y podría ejecutar una versión jugable, empaquetable y distribuible para ti en unas horas.

Si alguien está interesado, me tomaré el tiempo para construir esta Skill y hacerla de código abierto. De todas formas, la usaré yo mismo.

Demo del juego

El código es de código abierto, y los paquetes de instalación están listos:

https://github.com/op7418/Night-Patrol/releases

Save to YouMind

Use YouMind to read viral articles deeply

Save the source, ask focused questions, summarize the argument, and turn a viral article into reusable notes in one AI workspace.

Explore YouMind
Para creadores

Convierte tu Markdown en un artículo de 𝕏 impecable

Cuando publicas tus propios textos largos, dar formato en 𝕏 a imágenes, tablas y bloques de código es un fastidio. YouMind convierte un borrador completo en Markdown en un artículo de 𝕏 impecable y listo para publicar.

Prueba Markdown a 𝕏

Más patrones por descifrar

Artículos virales recientes

Explorar más artículos virales