Un'infografica raffinata sull'architettura dei sistemi verticali che mostra una pipeline di inferenza chat memorizzata in sette passaggi con rami di cache doppi, adatta per spiegazioni tecniche e presentazioni di prodotti.
Crea un'infografica pulita del flusso di lavoro tecnico verticale su uno sfondo grigio chiaro, utilizzando uno stile di diagramma di prodotto moderno e minimalista con schede bianche arrotondate, sottili contorni colorati, icone vettoriali semplici, testo blu scuro e frecce di collegamento blu scuro. La composizione è un unico diagramma di flusso centrato dall'alto verso il basso con 7 passaggi principali numerati, più 2 pannelli di gruppo cache paralleli che si diramano dal passaggio 4 al passaggio 5, e una spessa freccia di ritorno scura all'estrema sinistra che va dal basso verso l'alto. Utilizza una tipografia sans-serif nitida, una spaziatura generosa, colori pastello tenui, senza sfumature, senza ombre e con la chiarezza di una diapositiva di presentazione.
In alto al centro, posiziona la scheda del passaggio 1 con un contorno blu e un'icona di codice/chat a sinistra. Testo del titolo: "1. richiesta di completamento chat". Sottotitolo sotto: "conversation_id + cache_salt + nuovi messaggi suffisso".
Sotto di essa, posiziona la scheda del passaggio 2 con un contorno blu e un'icona di documento/elenco. Titolo: "2. Registro conversazione frontend". Sottotitolo: "mantieni lo stesso id + traccia i messaggi confermati".
Sotto di essa, posiziona la scheda del passaggio 3 con un contorno ciano e un'icona di database con lente d'ingrandimento. Titolo: "3. Ricerca esatta nella cache della conversazione". Sottotitolo: "conversation_id ↚ stato del turno confermato".
Sotto di essa, posiziona la scheda del passaggio 4 con un contorno viola e un'icona di scheduler con diramazione. Titolo: "4. Collegamento cache dello scheduler". Sottotitolo: "imposta num_computed_tokens + allega stato confermato".
Dal passaggio 4, diramati verso il basso in 2 pannelli di gruppo affiancati.
Pannello di gruppo sinistro: un contenitore arrotondato verde pallido intitolato "Gruppo cache KV full-attention". All'interno, impila 2 schede interne. La prima scheda interna ha un'icona a griglia verde, titolo "Riferimenti blocchi confermati", sottotitolo "condividi blocchi KV completi allineati". La seconda scheda interna sotto ha un'icona a fogli sovrapposti verde, titolo "Copia Tail COW", sottotitolo "copia coda KV non allineata". In fondo al pannello verde aggiungi un piccolo testo a piè di pagina: "tensori K/V impaginati per strati transformer".
Pannello di gruppo destro: un contenitore arrotondato viola pallido intitolato "Gruppo cache stato terminale Mamba". All'interno, impila 2 schede interne. La prima scheda interna ha un'icona di database/rete viola, titolo "Stato terminale confermato", sottotitolo "stato esatto alla lunghezza confermata". La seconda scheda interna sotto ha un'icona a linee ondulate viola, titolo "Copia terminale di proprietà della richiesta", sottotitolo "copia SSM + stato conv". In fondo al pannello viola aggiungi un piccolo testo a piè di pagina: "posizionamento stato terminale in modalità allineata".
Unisci entrambi gli output dei pannelli di gruppo in una scheda del passaggio 5 centrata con un contorno blu e un'icona di microchip. Titolo: "5. Esecuzione modello ibrido". Sottotitolo: "esegui solo il suffisso non memorizzato nella cache". All'interno dell'area inferiore di questa scheda, includi 2 etichette a forma di pillola affiancate: "Strati Transformer" e "Strati Mamba".
Sotto di essa, posiziona la scheda del passaggio 6 con un contorno blu e un'icona a stella. Titolo: "6. Decodifica token assistente". Sottotitolo: "trasmetti la risposta token per token".
Sotto di essa, posiziona la scheda del passaggio 7 con un contorno giallo-arancio caldo e un'icona di database con segno di spunta. Titolo: "7. Conferma turno completato". Sottotitolo: "pubblica lo stato in sospeso o scarta in caso di errore".
Aggiungi una spessa freccia di ritorno blu scuro che corre lungo l'estrema sinistra, entrando nel passaggio 1 vicino alla parte superiore da sinistra e tornando dal passaggio 7 in basso verso l'alto. Lungo questo ciclo sinistro, vicino alla metà inferiore, posiziona il testo di annotazione impilato: "la richiesta successiva riutilizza l'intestazione della conversazione confermata".
Aggiungi 2 frecce di pubblicazione tratteggiate che salgono verso l'alto dal passaggio 7 verso i pannelli del gruppo cache: una freccia tratteggiata verde a sinistra che punta al pannello cache verde, etichettata "pubblica nuovo stato"; una freccia tratteggiata viola a destra che punta al pannello cache viola, anch'essa etichettata "pubblica nuovo stato".
Mantieni il conteggio totale esatto di 7 schede principali numerate, 2 pannelli di gruppo cache, 4 schede cache interne e 2 etichette a pillola. Preserva un rapporto d'aspetto verticale simile a un diagramma di architettura per diapositive di conferenza.