Uma captura de tela de um fluxo de trabalho escuro do ComfyUI mostrando a edição de imagem por GPT controlada por instruções de texto incorporadas em uma máscara.
Objetivo: Criar uma imagem no estilo captura de tela widescreen de um gráfico de nós do ComfyUI em modo escuro, demonstrando a edição de imagem por GPT a partir de uma instrução de texto incorporada em uma máscara.
Canvas: Quadro horizontal de 1200×580, fundo de grade cinza-carvão, cortado como uma captura de tela real de um editor de fluxo de trabalho. Use painéis de interface nítidos com cantos arredondados, sombras sutis, texto de interface pequeno sem serifa e cabos de conexão coloridos.
Layout: Organize exatamente 7 nós de fluxo de trabalho visíveis da esquerda para a direita no canvas. Inclua 4 nós à esquerda, 1 nó de processamento central grande e 2 nós de saída/visualização à direita. Mostre soquetes de imagem azuis e soquetes de máscara verdes conectados por fios curvos.
Nós e conteúdos:
1. Nó superior esquerdo intitulado “Load Image (from Outputs)”. Ele mostra uma prévia retangular verde preenchida com um padrão geométrico repetitivo de círculos/arcos, rótulo de tamanho “1536 × 1024” e pequenos controles, incluindo seletor de imagem, alternância de atualização automática e botão de atualizar.
2. Nó superior central esquerdo intitulado “Load Image”. Ele mostra uma prévia retangular branca com um padrão fino de círculos pretos sobrepostos, rótulo de tamanho “1536 × 1024”. Conecte sua saída IMAGE azul à entrada de imagem do nó central.
3. Nó inferior central esquerdo intitulado “Load Image (as Mask)”. Ele mostra uma prévia escura com texto vermelho estilo pixel lendo “hello chatgpt” na primeira linha e “please make the image green” na segunda linha. O menu suspenso de canal diz “red”. Conecte sua saída MASK verde à entrada de máscara do nó central.
4. Nó inferior esquerdo intitulado “Load Comfy Clipspace Mask”. Inclua controles rotulados como clipspace_file “latest” e alternância invert_mask, além de pequenos soquetes de imagem e máscara. Este nó é visível, mas não é a conexão principal.
5. Nó central intitulado “OpenAI GPT Image Direct”. Ele possui entradas rotuladas como image e mask; saídas rotuladas como images, mask e revised_prompts. A caixa de texto de prompt contém follow the instructions in the mask. Configurações visíveis: model gpt-image-2, quality medium, size 1536x1024, custom_width 1024, custom_height 1024, n 1, output_format png. Conecte sua saída images azul ao Save Image, e sua saída de máscara cinza/verde ou de prompt revisado para baixo até Preview as Text.
6. Nó superior direito intitulado “Save Image”. Ele mostra filename_prefix “ComfyUI” e uma prévia do resultado: o mesmo padrão circular agora colorido em verde brilhante, com a instrução de texto preta sobreposta no canto superior esquerdo lendo “hello chatgpt” e “please make the image green”; rótulo de tamanho “1536 × 1024”.
7. Nó inferior direito intitulado “Preview as Text”, parcialmente cortado na borda inferior, conectado a partir da saída revised_prompts do nó central; mostre um pequeno rótulo “source” e uma área de “Preview”.
Estilo visual: Captura de tela de interface realista, tema escuro, grade sutil, painéis arredondados em preto e cinza, rótulos de interface brancos e cinzas, pontos de soquete azuis e verdes, linhas de conexão curvas azuis/verdes. As prévias de imagem geradas devem parecer planas e procedurais, em vez de fotorrealistas.
Restrições: Mantenha o conceito exato do fluxo de trabalho legível: uma imagem de entrada com padrão branco mais uma máscara contendo instruções de texto produz uma saída com padrão verde. Não adicione pessoas, marcas fora dos rótulos do ComfyUI/OpenAI, nós extras ou elementos decorativos.