Una captura de pantalla de un flujo de trabajo oscuro de ComfyUI que muestra la edición de imágenes con GPT controlada por instrucciones de texto integradas en una máscara.
Objetivo: Crear una imagen estilo captura de pantalla panorámica de un grafo de nodos oscuro de ComfyUI que demuestre la edición de imágenes con GPT a partir de una instrucción de texto integrada en una máscara.
Lienzo: Marco horizontal de 1200×580, fondo de cuadrícula gris oscuro, recortado como una captura de pantalla real de un editor de flujo de trabajo. Utilice paneles de interfaz nítidos con esquinas redondeadas, sombras sutiles, texto de interfaz pequeño sin serifa y cables de conexión de colores.
Diseño: Organice exactamente 7 nodos de flujo de trabajo visibles de izquierda a derecha a través del lienzo. Incluya 4 nodos a la izquierda, 1 nodo de procesamiento central grande y 2 nodos de salida/vista previa a la derecha. Muestre conectores de imagen azules y conectores de máscara verdes conectados por cables curvos.
Nodos y contenidos:
1. Nodo superior izquierdo titulado “Load Image (from Outputs)”. Muestra una vista previa rectangular verde llena de un patrón geométrico de círculos/arcos repetidos, etiqueta de tamaño “1536 × 1024” y controles pequeños que incluyen selector de imagen, interruptor de actualización automática y botón de actualizar.
2. Nodo superior central izquierdo titulado “Load Image”. Muestra una vista previa rectangular blanca con un patrón de círculos superpuestos repetidos en negro fino, etiqueta de tamaño “1536 × 1024”. Conecte su salida de IMAGEN azul a la entrada de imagen del nodo central.
3. Nodo inferior central izquierdo titulado “Load Image (as Mask)”. Muestra una vista previa oscura con texto rojo tipo píxel que dice “hello chatgpt” en la primera línea y “please make the image green” en la segunda línea. El menú desplegable de canal dice “red”. Conecte su salida de MÁSCARA verde a la entrada de máscara del nodo central.
4. Nodo inferior izquierdo titulado “Load Comfy Clipspace Mask”. Incluya controles etiquetados como clipspace_file “latest” e interruptor invert_mask, además de pequeños conectores de imagen y máscara. Este nodo es visible pero no es la conexión principal.
5. Nodo central titulado “OpenAI GPT Image Direct”. Tiene entradas etiquetadas como image y mask; salidas etiquetadas como images, mask y revised_prompts. El cuadro de texto de prompt contiene follow the instructions in the mask. Configuración visible: model gpt-image-2, quality medium, size 1536x1024, custom_width 1024, custom_height 1024, n 1, output_format png. Conecte su salida de imágenes azul a Save Image, y su salida de máscara o prompt revisado gris/verde hacia abajo a Preview as Text.
6. Nodo superior derecho titulado “Save Image”. Muestra filename_prefix “ComfyUI” y una vista previa del resultado: el mismo patrón circular ahora coloreado en verde brillante, con la instrucción de texto negra superpuesta en la parte superior izquierda que dice “hello chatgpt” y “please make the image green”; etiqueta de tamaño “1536 × 1024”.
7. Nodo inferior derecho titulado “Preview as Text”, parcialmente recortado en el borde inferior, conectado desde la salida de revised_prompts del nodo central; muestre una pequeña etiqueta “source” y un área de “Preview”.
Estilo visual: Captura de pantalla de interfaz realista, tema oscuro, cuadrícula sutil, paneles redondeados gris-negro, etiquetas de interfaz blancas y grises, puntos de conexión azules y verdes, líneas de conexión curvas azules/verdes. Las vistas previas de las imágenes generadas deben verse planas y procedimentales en lugar de fotorrealistas.
Restricciones: Mantenga el concepto del flujo de trabajo legible: una imagen de entrada con patrón blanco más una máscara que contiene instrucciones de texto produce una salida con patrón verde. No añada personas, marcas fuera de las etiquetas de ComfyUI/OpenAI, nodos adicionales ni elementos decorativos.