Diagrama de flujo de ejecución de caché híbrida

Una infografía pulida de arquitectura de sistemas en vertical que muestra un proceso de inferencia de chat en caché de siete pasos con ramas de caché duales, ideal para explicaciones técnicas y presentaciones de productos.

Instrucción
Crea una infografía de flujo de trabajo técnico vertical y limpia sobre un fondo gris claro, utilizando un estilo de diagrama de producto moderno y minimalista con tarjetas blancas redondeadas, contornos finos de colores, iconos vectoriales de líneas simples, texto azul marino oscuro y flechas conectoras azul marino. La composición consiste en un único diagrama de flujo centrado de arriba a abajo con 7 pasos principales numerados, además de 2 paneles de grupos de caché paralelos que se ramifican del paso 4 al paso 5, y una flecha de retorno gruesa y oscura en el extremo izquierdo que vuelve desde la parte inferior hacia la parte superior. Utiliza tipografía sans-serif nítida, espaciado generoso, colores pastel sutiles, sin degradados, sin sombras y con la claridad de una diapositiva de presentación. En la parte superior central, coloca la tarjeta del paso 1 con un contorno azul y un icono de código/chat a la izquierda. Título: "1. solicitud de finalización de chat". Subtítulo debajo: "conversation_id + cache_salt + new suffix messages". Debajo, coloca la tarjeta del paso 2 con un contorno azul y un icono de documento/lista. Título: "2. Libro de registro de conversación frontend". Subtítulo: "lease same id + track committed messages". Debajo, coloca la tarjeta del paso 3 con un contorno cian y un icono de base de datos con lupa. Título: "3. Búsqueda exacta en caché de conversación". Subtítulo: "conversation_id ␚ committed turn state". Debajo, coloca la tarjeta del paso 4 con un contorno morado y un icono de programador con ramificaciones. Título: "4. Adjunto de caché del programador". Subtítulo: "set num_computed_tokens + attach committed state". Desde el paso 4, ramifica hacia abajo en 2 paneles de grupo lado a lado. Panel de grupo izquierdo: un contenedor redondeado verde pálido titulado "Full-attention KV cache group". Dentro, apila 2 tarjetas internas. La primera tarjeta interna tiene un icono de cuadrícula de bloques verde, título "Committed block refs", subtítulo "share aligned full KV blocks". La segunda tarjeta interna debajo tiene un icono de hojas superpuestas verde, título "Tail COW copy", subtítulo "copy unaligned KV tail". En la parte inferior del panel verde, añade un pequeño pie de página: "paged K/V tensors for transformer layers". Panel de grupo derecho: un contenedor redondeado morado pálido titulado "Mamba terminal-state cache group". Dentro, apila 2 tarjetas internas. La primera tarjeta interna tiene un icono de base de datos/red morado, título "Committed terminal state", subtítulo "exact state at committed length". La segunda tarjeta interna debajo tiene un icono de líneas onduladas morado, título "Request-owned terminal copy", subtítulo "copy SSM + conv state". En la parte inferior del panel morado, añade un pequeño pie de página: "align-mode terminal state placement". Fusiona las salidas de ambos paneles de grupo en una tarjeta de paso 5 centrada con un contorno azul y un icono de microchip. Título: "5. Ejecución de modelo híbrido". Subtítulo: "run only the uncached suffix". Dentro del área inferior de esta tarjeta, incluye 2 etiquetas con forma de píldora lado a lado: "Transformer layers" y "Mamba layers". Debajo, coloca la tarjeta del paso 6 con un contorno azul y un icono de destello. Título: "6. Decodificar tokens del asistente". Subtítulo: "stream response token by token". Debajo, coloca la tarjeta del paso 7 con un contorno amarillo-naranja cálido y un icono de base de datos con marca de verificación. Título: "7. Confirmar turno completado". Subtítulo: "publish pending state or discard on failure". Añade una flecha de bucle gruesa de color azul marino oscuro que baje por el extremo izquierdo, entrando al paso 1 cerca de la parte superior desde la izquierda y regresando desde el paso 7 en la parte inferior hacia arriba. A lo largo de este bucle izquierdo, cerca de la mitad inferior, coloca texto de anotación apilado: "next request reuses committed conversation head". Añade 2 flechas de publicación discontinuas que suban desde el paso 7 hacia los paneles de grupo de caché: una flecha discontinua verde a la izquierda apuntando al panel de caché verde, etiquetada "publish new state"; una flecha discontinua morada a la derecha apuntando al panel de caché morado, también etiquetada "publish new state". Mantén el recuento total exacto de 7 tarjetas principales numeradas, 2 paneles de grupo de caché, 4 tarjetas de caché internas y 2 etiquetas de píldora. Conserva una relación de aspecto vertical similar a un diagrama de arquitectura de diapositiva de conferencia.

Cómo usar este prompt

  1. 1

    Copia el prompt completo de arriba.

  2. 2

    Abre una plataforma compatible con GPT Image 2, como YouMind, y pega el prompt.

  3. 3

    Cambia el tema, el estilo o los detalles según tu idea y luego genera.

Este es un prompt de IA gratuito de la biblioteca de prompts de YouMind. Explora miles de prompts de imagen más, todos gratis para copiar y adaptar.

Explorar más prompts de imagen

Más funciones de prompts

Biblioteca de IA

Búsqueda de prompts con IA

Deja que la IA busque entre decenas de miles de prompts. Filtra por modelo, rango de fechas y palabras clave, y ordena por interacción: visualizaciones, guardados, compartidos y más.

Herramientas de visión

Imagen a prompt

Convierte cualquier foto en un prompt de imagen IA detallado. El conversor gratuito de imagen a prompt analiza composición, estilo e iluminación para recrear cualquier estética en segundos.

Creado para creadores. Gratis para siempre.

YouMind es el copiloto creativo con IA en el que confían creadores de todo el mundo. Cada prompt está curado para ayudarte a crear mejor y más rápido.

Explorar más prompts