Một infographic kiến trúc hệ thống dạng dọc tinh tế, mô tả quy trình suy luận trò chuyện qua bộ nhớ đệm gồm bảy bước với các nhánh bộ nhớ đệm kép, phù hợp cho các bài giải thích kỹ thuật và thuyết trình sản phẩm.
Tạo một infographic quy trình kỹ thuật dạng dọc, sạch sẽ trên nền xám nhạt, sử dụng phong cách sơ đồ sản phẩm hiện đại tối giản với các thẻ trắng bo góc, đường viền mảnh có màu, biểu tượng vector đơn giản, văn bản màu xanh navy đậm và các mũi tên kết nối màu navy. Bố cục là một sơ đồ luồng từ trên xuống dưới duy nhất ở giữa với 7 bước chính được đánh số, cộng với 2 bảng nhóm bộ nhớ đệm song song phân nhánh từ bước 4 sang bước 5, và một mũi tên quay lại dày màu tối ở phía xa bên trái chạy từ dưới lên trên. Sử dụng kiểu chữ không chân sắc nét, khoảng cách rộng rãi, màu nhấn pastel tinh tế, không có hiệu ứng chuyển màu (gradient), không có đổ bóng và đảm bảo độ rõ nét như trên Slides thuyết trình.
Ở trung tâm phía trên, đặt thẻ bước 1 với đường viền màu xanh dương và biểu tượng mã/trò chuyện ở bên trái. Tiêu đề: "1. yêu cầu hoàn tất trò chuyện". Phụ đề bên dưới: "conversation_id + cache_salt + tin nhắn hậu tố mới".
Bên dưới, đặt thẻ bước 2 với đường viền màu xanh dương và biểu tượng tài liệu/danh sách. Tiêu đề: "2. Sổ cái hội thoại giao diện người dùng". Phụ đề: "giữ cùng id + theo dõi các tin nhắn đã cam kết".
Bên dưới, đặt thẻ bước 3 với đường viền màu lục lam và biểu tượng cơ sở dữ liệu với kính lúp. Tiêu đề: "3. Tra cứu bộ nhớ đệm hội thoại chính xác". Phụ đề: "conversation_id trạng thái lượt đã cam kết".
Bên dưới, đặt thẻ bước 4 với đường viền màu tím và biểu tượng bộ lập lịch phân nhánh. Tiêu đề: "4. Đính kèm bộ nhớ đệm bộ lập lịch". Phụ đề: "thiết lập num_computed_tokens + đính kèm trạng thái đã cam kết".
Từ bước 4, phân nhánh xuống dưới thành 2 bảng nhóm đặt cạnh nhau.
Bảng nhóm bên trái: một thùng chứa bo góc màu xanh lá nhạt có tiêu đề "Nhóm bộ nhớ đệm KV chú ý đầy đủ". Bên trong, xếp chồng 2 thẻ con. Thẻ con đầu tiên có biểu tượng lưới khối màu xanh lá, tiêu đề "Tham chiếu khối đã cam kết", phụ đề "chia sẻ các khối KV đầy đủ đã căn chỉnh". Thẻ con thứ hai bên dưới có biểu tượng các lớp xếp chồng màu xanh lá, tiêu đề "Sao chép đuôi COW", phụ đề "sao chép đuôi KV chưa căn chỉnh". Ở dưới cùng của bảng màu xanh lá, thêm văn bản chân trang nhỏ: "tensor K/V được phân trang cho các lớp transformer".
Bảng nhóm bên phải: một thùng chứa bo góc màu tím nhạt có tiêu đề "Nhóm bộ nhớ đệm trạng thái thiết bị đầu cuối Mamba". Bên trong, xếp chồng 2 thẻ con. Thẻ con đầu tiên có biểu tượng cơ sở dữ liệu/mạng màu tím, tiêu đề "Trạng thái thiết bị đầu cuối đã cam kết", phụ đề "trạng thái chính xác tại độ dài đã cam kết". Thẻ con thứ hai bên dưới có biểu tượng đường sóng màu tím, tiêu đề "Bản sao thiết bị đầu cuối thuộc sở hữu của yêu cầu", phụ đề "sao chép trạng thái SSM + conv". Ở dưới cùng của bảng màu tím, thêm văn bản chân trang nhỏ: "vị trí trạng thái thiết bị đầu cuối chế độ căn chỉnh".
Hợp nhất đầu ra của cả hai bảng nhóm vào thẻ bước 5 ở giữa với đường viền màu xanh dương và biểu tượng vi mạch. Tiêu đề: "5. Thực thi mô hình lai". Phụ đề: "chỉ chạy hậu tố chưa lưu bộ nhớ đệm". Bên trong khu vực dưới cùng của thẻ này, bao gồm 2 nhãn hình viên thuốc đặt cạnh nhau: "Lớp Transformer" và "Lớp Mamba".
Bên dưới, đặt thẻ bước 6 với đường viền màu xanh dương và biểu tượng tia sáng. Tiêu đề: "6. Giải mã các token trợ lý". Phụ đề: "truyền phát phản hồi từng token một".
Bên dưới, đặt thẻ bước 7 với đường viền màu vàng cam ấm và biểu tượng cơ sở dữ liệu với dấu kiểm. Tiêu đề: "7. Cam kết lượt đã hoàn thành". Phụ đề: "xuất bản trạng thái chờ xử lý hoặc hủy bỏ khi thất bại".
Thêm một mũi tên vòng lặp màu xanh navy đậm dày chạy dọc phía xa bên trái, đi vào bước 1 gần phía trên từ bên trái và quay trở lại từ bước 7 ở dưới cùng lên trên. Dọc theo vòng lặp bên trái này, gần nửa dưới, đặt văn bản chú thích xếp chồng: "yêu cầu tiếp theo sử dụng lại phần đầu hội thoại đã cam kết".
Thêm 2 mũi tên xuất bản nét đứt hướng lên trên từ bước 7 về phía các bảng nhóm bộ nhớ đệm: một mũi tên nét đứt màu xanh lá ở bên trái trỏ đến bảng bộ nhớ đệm màu xanh lá, được dán nhãn "xuất bản trạng thái mới"; một mũi tên nét đứt màu tím ở bên phải trỏ đến bảng bộ nhớ đệm màu tím, cũng được dán nhãn "xuất bản trạng thái mới".
Giữ nguyên tổng số 7 thẻ chính được đánh số, 2 bảng nhóm bộ nhớ đệm, 4 thẻ bộ nhớ đệm con và 2 nhãn hình viên thuốc. Duy trì tỷ lệ khung hình dọc tương tự như sơ đồ kiến trúc trên Slides hội nghị.