ผังขั้นตอนการทำงานของ Hybrid Cache

อินโฟกราฟิกสถาปัตยกรรมระบบแนวตั้งที่ดูเป็นมืออาชีพ แสดงขั้นตอนการอนุมานแชทแบบแคช 7 ขั้นตอน พร้อมสาขาแคชคู่ เหมาะสำหรับคำอธิบายทางเทคนิคและการนำเสนอผลิตภัณฑ์

พรอมต์
สร้างอินโฟกราฟิกเวิร์กโฟลว์ทางเทคนิคแนวตั้งที่สะอาดตาบนพื้นหลังสีเทาอ่อน โดยใช้สไตล์แผนภาพผลิตภัณฑ์แบบมินิมอลที่ทันสมัย ประกอบด้วยการ์ดสีขาวขอบมน เส้นขอบสีบาง ไอคอนเวกเตอร์เส้นสายเรียบง่าย ข้อความสีน้ำเงินเข้ม และลูกศรเชื่อมต่อสีน้ำเงินเข้ม องค์ประกอบภาพเป็นผังงานแบบบนลงล่างที่จัดกึ่งกลาง มีขั้นตอนหลักที่ใส่หมายเลข 7 ขั้นตอน พร้อมแผงกลุ่มแคชคู่ขนาน 2 แผงที่แยกออกจากขั้นตอนที่ 4 ไปยังขั้นตอนที่ 5 และมีลูกศรย้อนกลับสีเข้มหนาทางด้านซ้ายสุดที่วนจากด้านล่างกลับขึ้นไปด้านบน ใช้ตัวอักษรแบบไม่มีหัว (sans-serif) ที่คมชัด เว้นระยะห่างอย่างเหมาะสม ใช้สีพาสเทลเน้นจุดสำคัญ ไม่มีเงา ไม่มีไล่เฉดสี และมีความชัดเจนเหมือนสไลด์นำเสนอ ที่กึ่งกลางด้านบน ให้วางการ์ดขั้นตอนที่ 1 พร้อมขอบสีน้ำเงินและไอคอนโค้ด/แชททางด้านซ้าย ข้อความหัวเรื่อง: "1. chat completions request" คำบรรยายด้านล่าง: "conversation_id + cache_salt + new suffix messages" ด้านล่างให้วางการ์ดขั้นตอนที่ 2 พร้อมขอบสีน้ำเงินและไอคอนเอกสาร/รายการ หัวเรื่อง: "2. Frontend conversation ledger" คำบรรยาย: "lease same id + track committed messages" ด้านล่างให้วางการ์ดขั้นตอนที่ 3 พร้อมขอบสีฟ้าและไอคอนฐานข้อมูลพร้อมแว่นขยาย หัวเรื่อง: "3. Exact conversation cache lookup" คำบรรยาย: "conversation_id  committed turn state" ด้านล่างให้วางการ์ดขั้นตอนที่ 4 พร้อมขอบสีม่วงและไอคอนตัวจัดกำหนดการแบบแยกสาขา หัวเรื่อง: "4. Scheduler cache attachment" คำบรรยาย: "set num_computed_tokens + attach committed state" จากขั้นตอนที่ 4 ให้แยกสาขาลงมาเป็นแผงกลุ่ม 2 แผงวางเคียงข้างกัน แผงกลุ่มด้านซ้าย: คอนเทนเนอร์ขอบมนสีเขียวอ่อน หัวเรื่อง "Full-attention KV cache group" ภายในให้วางการ์ดซ้อนกัน 2 ใบ การ์ดใบแรกมีไอคอนตารางบล็อกสีเขียว หัวเรื่อง "Committed block refs" คำบรรยาย "share aligned full KV blocks" การ์ดใบที่สองด้านล่างมีไอคอนแผ่นเลเยอร์สีเขียว หัวเรื่อง "Tail COW copy" คำบรรยาย "copy unaligned KV tail" ที่ด้านล่างของแผงสีเขียวให้เพิ่มข้อความท้ายกระดาษขนาดเล็ก: "paged K/V tensors for transformer layers" แผงกลุ่มด้านขวา: คอนเทนเนอร์ขอบมนสีม่วงอ่อน หัวเรื่อง "Mamba terminal-state cache group" ภายในให้วางการ์ดซ้อนกัน 2 ใบ การ์ดใบแรกมีไอคอนฐานข้อมูล/เครือข่ายสีม่วง หัวเรื่อง "Committed terminal state" คำบรรยาย "exact state at committed length" การ์ดใบที่สองด้านล่างมีไอคอนเส้นคลื่นสีม่วง หัวเรื่อง "Request-owned terminal copy" คำบรรยาย "copy SSM + conv state" ที่ด้านล่างของแผงสีม่วงให้เพิ่มข้อความท้ายกระดาษขนาดเล็ก: "align-mode terminal state placement" รวมผลลัพธ์จากทั้งสองแผงกลุ่มเข้าสู่การ์ดขั้นตอนที่ 5 ที่จัดกึ่งกลาง พร้อมขอบสีน้ำเงินและไอคอนไมโครชิป หัวเรื่อง: "5. Hybrid model execution" คำบรรยาย: "run only the uncached suffix" ภายในพื้นที่ด้านล่างของการ์ดนี้ ให้ใส่ป้ายกำกับรูปทรงแคปซูล 2 อันวางเคียงข้างกัน: "Transformer layers" และ "Mamba layers" ด้านล่างให้วางการ์ดขั้นตอนที่ 6 พร้อมขอบสีน้ำเงินและไอคอนประกายไฟ หัวเรื่อง: "6. Decode assistant tokens" คำบรรยาย: "stream response token by token" ด้านล่างให้วางการ์ดขั้นตอนที่ 7 พร้อมขอบสีเหลืองส้มโทนอุ่นและไอคอนฐานข้อมูลพร้อมเครื่องหมายถูก หัวเรื่อง: "7. Commit completed turn" คำบรรยาย: "publish pending state or discard on failure" เพิ่มลูกศรวนสีน้ำเงินเข้มหนาทางด้านซ้ายสุด โดยวิ่งเข้าสู่ขั้นตอนที่ 1 ใกล้กับด้านบนจากทางซ้าย และวนกลับจากขั้นตอนที่ 7 ที่ด้านล่างขึ้นไปด้านบน ตามแนววนด้านซ้ายนี้ ใกล้กับครึ่งล่าง ให้วางข้อความกำกับที่ซ้อนกันว่า: "next request reuses committed conversation head" เพิ่มลูกศรเผยแพร่แบบเส้นประ 2 เส้นที่พุ่งขึ้นจากขั้นตอนที่ 7 ไปยังแผงกลุ่มแคช: ลูกศรเส้นประสีเขียวทางซ้ายชี้ไปที่แผงแคชสีเขียว พร้อมป้ายกำกับ "publish new state"; ลูกศรเส้นประสีม่วงทางขวาชี้ไปที่แผงแคชสีม่วง พร้อมป้ายกำกับ "publish new state" เช่นกัน คงจำนวนการ์ดหลักที่ใส่หมายเลขไว้ 7 ใบ แผงกลุ่มแคช 2 แผง การ์ดแคชภายใน 4 ใบ และป้ายกำกับรูปแคปซูล 2 อันไว้ตามเดิม รักษาอัตราส่วนภาพแนวตั้งให้คล้ายกับแผนภาพสถาปัตยกรรมในสไลด์การประชุม

วิธีใช้ prompt นี้

  1. 1

    คัดลอก prompt เต็มด้านบน

  2. 2

    เปิดแพลตฟอร์มที่รองรับ GPT Image 2 เช่น YouMind แล้ววาง prompt ลงไป

  3. 3

    เปลี่ยนหัวข้อ สไตล์ หรือรายละเอียดให้ตรงไอเดียของคุณ แล้วสร้าง

นี่คือ AI prompt ฟรีจากคลัง prompt ของ YouMind สำรวจ ภาพ prompt อีกนับพันรายการ ทั้งหมดคัดลอกและปรับใช้ได้ฟรี

ดู ภาพ prompt เพิ่มเติม

ฟีเจอร์พรอมต์เพิ่มเติม

คลัง AI

ค้นหา prompt ด้วย AI

ให้ AI ช่วยค้นหา prompt หลายหมื่นรายการ กรองตามโมเดล ช่วงเวลา คีย์เวิร์ด และจัดเรียงตามยอดมีส่วนร่วม เช่น ยอดวิว ยอดบันทึก ยอดแชร์ และอื่นๆ

เครื่องมือด้านภาพ

รูปภาพเป็นพรอมต์

เปลี่ยนรูปภาพใดก็ได้ให้เป็นพรอมต์ภาพ AI แบบละเอียด เครื่องมือแปลงรูปภาพเป็นพรอมต์ฟรีจะวิเคราะห์องค์ประกอบ สไตล์ และแสง ให้คุณสร้างลุคเดิมซ้ำได้ในไม่กี่วินาที

สร้างมาเพื่อครีเอเตอร์ ฟรีตลอดไป

YouMind คือผู้ช่วยสร้างสรรค์ AI ที่ครีเอเตอร์ทั่วโลกไว้วางใจ ทุกพรอมต์ที่นี่คัดสรรมาเพื่อช่วยให้คุณสร้างสรรค์ได้ดีและเร็วขึ้น