Ảnh chụp màn hình quy trình làm việc ComfyUI tối màu hiển thị tính năng chỉnh sửa hình ảnh bằng GPT, được điều khiển thông qua các hướng dẫn văn bản nhúng trong mặt nạ (mask).
Mục tiêu: Tạo một hình ảnh theo phong cách ảnh chụp màn hình khổ rộng của biểu đồ nút ComfyUI tối màu, minh họa việc chỉnh sửa hình ảnh bằng GPT từ hướng dẫn văn bản nhúng trong mặt nạ.
Khung hình: Khung ngang 1200×580, nền lưới màu xám than, được cắt cúp giống như ảnh chụp màn hình trình chỉnh sửa quy trình làm việc thực tế. Sử dụng các bảng điều khiển giao diện sắc nét với các góc bo tròn, đổ bóng tinh tế, văn bản giao diện không chân (sans-serif) nhỏ và các dây cáp kết nối có màu sắc.
Bố cục: Sắp xếp chính xác 7 nút quy trình làm việc hiển thị từ trái sang phải trên khung hình. Bao gồm 4 nút ở bên trái, 1 nút xử lý trung tâm lớn và 2 nút đầu ra/xem trước ở bên phải. Hiển thị các ổ cắm hình ảnh màu xanh dương và ổ cắm mặt nạ màu xanh lá cây được kết nối bằng các đường dây cong.
Các nút và nội dung:
1. Nút trên cùng bên trái có tiêu đề “Load Image (from Outputs)”. Nó hiển thị bản xem trước hình chữ nhật màu xanh lá cây chứa đầy họa tiết hình học vòng tròn/cung lặp lại, nhãn kích thước “1536 × 1024” và các điều khiển nhỏ bao gồm bộ chọn hình ảnh, nút bật/tắt tự động làm mới và nút làm mới.
2. Nút giữa bên trái phía trên có tiêu đề “Load Image”. Nó hiển thị bản xem trước hình chữ nhật màu trắng với họa tiết vòng tròn chồng lấp lặp lại màu đen mỏng, nhãn kích thước “1536 × 1024”. Kết nối đầu ra IMAGE màu xanh dương của nó với đầu vào hình ảnh của nút trung tâm.
3. Nút giữa bên trái phía dưới có tiêu đề “Load Image (as Mask)”. Nó hiển thị bản xem trước tối màu với văn bản giống pixel màu đỏ ghi “hello chatgpt” ở dòng đầu tiên và “please make the image green” ở dòng thứ hai. Menu thả xuống kênh hiển thị “red”. Kết nối đầu ra MASK màu xanh lá cây của nó với đầu vào mặt nạ của nút trung tâm.
4. Nút dưới cùng bên trái có tiêu đề “Load Comfy Clipspace Mask”. Bao gồm các điều khiển được dán nhãn clipspace_file “latest” và nút bật/tắt invert_mask, cùng với các ổ cắm hình ảnh và mặt nạ nhỏ. Nút này hiển thị nhưng không phải là kết nối chính.
5. Nút trung tâm có tiêu đề “OpenAI GPT Image Direct”. Nó có các đầu vào được dán nhãn image và mask; các đầu ra được dán nhãn images, mask và revised_prompts. Hộp văn bản prompt chứa follow the instructions in the mask. Các cài đặt hiển thị: model gpt-image-2, quality medium, size 1536x1024, custom_width 1024, custom_height 1024, n 1, output_format png. Kết nối đầu ra images màu xanh dương của nó với Save Image, và đầu ra mặt nạ hoặc revised prompt màu xám/xanh lá cây của nó xuống Preview as Text.
6. Nút trên cùng bên phải có tiêu đề “Save Image”. Nó hiển thị filename_prefix “ComfyUI” và bản xem trước kết quả: cùng một họa tiết vòng tròn nhưng giờ đã được tô màu xanh lá cây sáng, với hướng dẫn văn bản màu đen phủ lên ở góc trên bên trái ghi “hello chatgpt” và “please make the image green”; nhãn kích thước “1536 × 1024”.
7. Nút dưới cùng bên phải có tiêu đề “Preview as Text”, bị cắt một phần ở cạnh dưới, được kết nối từ đầu ra revised_prompts của nút trung tâm; hiển thị nhãn “source” nhỏ và khu vực “Preview”.
Phong cách hình ảnh: Ảnh chụp màn hình giao diện thực tế, chủ đề tối, lưới tinh tế, các bảng điều khiển màu đen-xám bo tròn, nhãn giao diện màu trắng và xám, các điểm ổ cắm màu xanh dương và xanh lá cây, các đường kết nối cong màu xanh dương/xanh lá cây. Các bản xem trước hình ảnh được tạo nên trông phẳng và mang tính quy trình thay vì chân thực như ảnh chụp.
Hạn chế: Giữ cho khái niệm quy trình làm việc chính xác và dễ đọc: một hình ảnh đầu vào có họa tiết màu trắng cộng với một mặt nạ chứa hướng dẫn văn bản tạo ra kết quả đầu ra có họa tiết màu xanh lá cây. Không thêm người, thương hiệu bên ngoài nhãn ComfyUI/OpenAI, các nút bổ sung hoặc các yếu tố trang trí.