พรอมต์นี้ใช้สร้างอินโฟกราฟิกเพื่อการศึกษาแนวนอนสไตล์วาดมือโทนพาสเทล อธิบายวิธีการทำ Tokenization 4 รูปแบบ โดยมีคุณครูชิบะอินุและมาสคอต Token สีฟ้า เหมาะสำหรับโพสต์ให้ความรู้บนโซเชียลมีเดีย
อินโฟกราฟิกเพื่อการศึกษาแนวนอนสไตล์สมุดภาพวาดมือน่ารัก ๆ บนพื้นหลังกระดาษสีเบจโทนอุ่น ขอบมน ตกแต่งด้วยลายเส้นดูเดิลสีพาสเทล สติกเกอร์เทปกาว รูปดาวดวงเล็ก ๆ และให้ความรู้สึกเหมือนสมุดจดในห้องเรียน ตรงกลางด้านบนมีหัวข้อขนาดใหญ่ด้วยลายมือภาษาจีนที่ดูสนุกสนานว่า "什么是分词?" (การทำ Tokenization คืออะไร?) โดยครึ่งหลังเป็นสีชมพูคอรัลและส่วนที่เหลือเป็นสีน้ำตาลเข้ม ที่มุมซ้ายบนมีตัวละครคุณครูชิบะอินุจิบิยืนหันหน้าตรง สวมเสื้อสีเหลืองอ่อนและเนคไทสีฟ้า ถือไม้ชี้ขึ้นด้านบน พร้อมกรอบคำพูดว่า "今天来学习分词(Tokenization)!" (วันนี้มาเรียนเรื่อง Tokenization กันเถอะ!) ที่มุมขวาบนมีมาสคอต Token ทรงสี่เหลี่ยมสีฟ้าสุดน่ารักที่เขียนว่า "TOKEN" กำลังยิ้ม มีแก้มสีชมพู ขาและแขนเล็ก ๆ และถือแว่นขยาย ข้าง ๆ มีกรอบคำพูดว่า "我是 Token!被切得越合理,模型越聪明!" (ฉันคือ Token! ยิ่งถูกตัดแบ่งอย่างสมเหตุสมผล โมเดลก็จะยิ่งฉลาด!) ใกล้ขอบด้านขวา ให้เพิ่มกระดาษโน้ตแขวนขนาดเล็กที่เขียนว่า "知识点 收藏夹" (เกร็ดความรู้ รายการโปรด) พร้อมไอคอนรูปหัวใจ ใต้หัวข้อให้วางกล่องข้อความเส้นประขอบมนที่มีคำจำกัดความว่า "分词是将人类可读的文本切分成 Token 的过程。" (การทำ Tokenization คือกระบวนการตัดแบ่งข้อความที่มนุษย์อ่านได้ออกเป็น Token) โดยเน้นคำว่า "Token" เป็นสีฟ้า ด้านล่างนั้นให้เพิ่มบรรทัดข้อความอธิบายว่า "下面以 “程序员Left” 和 “人工智能” 为例,看看不同的分词方式:" (ลองมาดูวิธีการทำ Tokenization แบบต่าง ๆ โดยใช้ตัวอย่างคำว่า "程序员Left" และ "人工智能" กัน) โดยเน้นคำว่า "程序员Left" เป็นสีฟ้าอ่อนและ "人工智能" เป็นสีชมพู ครึ่งล่างประกอบด้วยแผงสีพาสเทลขอบมน 4 แผงเรียงจากซ้ายไปขวา แต่ละแผงมีป้ายหมายเลขและหัวข้อ แผงที่ 1 เป็นสีเขียวมิ้นต์ หัวข้อ "1 词级分词" (การทำ Tokenization ระดับคำ) มีคำบรรยายใต้หัวข้อว่า "按完整语义划分文本" (แบ่งข้อความตามความหมายที่สมบูรณ์) และมีฟองสบู่ Token 3 วง: "程序员", "Left", "人工智能" ที่ด้านล่างของแผงนี้ ให้แสดงคุณครูชิบะอินุชูนิ้วโป้งพร้อมกรอบคำพูดว่า "语义完整,容易理解!" (ความหมายสมบูรณ์ เข้าใจง่าย!) แผงที่ 2 เป็นสีเหลืองอ่อน หัวข้อ "2 字符级分词" (การทำ Tokenization ระดับตัวอักษร) มีคำบรรยายใต้หัวข้อว่า "逐字切分文本" (ตัดแบ่งข้อความทีละตัวอักษร) และมีฟองสบู่ Token วงกลม 9 วงเรียงเป็นแถว: "程", "序", "员", "L", "e", "f", "t", "人", "工", "智", "能" ซึ่งนำเสนอเป็นตัวอักษรแต่ละตัวจากข้อความตัวอย่างในตารางที่กะทัดรัด ที่ด้านล่างให้แสดงมาสคอต Token สีฟ้าถือดินสอพร้อมกรอบคำพูดว่า "粒度最细,但序列会很长~" (ละเอียดที่สุด แต่ลำดับจะยาวมาก~) แผงที่ 3 เป็นสีชมพูอ่อน หัวข้อ "3 子词分词" (การทำ Tokenization ระดับคำย่อย) มีคำบรรยายใต้หัวข้อว่า "按词根以及前后缀划分" (แบ่งตามรากศัพท์และคำอุปสรรค/ปัจจัย) และมีฟองสบู่ Token 5 วง: "程序", "员", "Left", "人工", "智能" ที่ด้านล่างให้แสดงคุณครูชิบะอินุกำลังใช้ความคิดโดยเอามือแตะปากและมีเครื่องหมายคำถามอยู่เหนือหัว พร้อมกรอบคำพูดว่า "折中方案,效果 often 很好!" (เป็นวิธีสายกลางที่มักให้ผลลัพธ์ที่ดี!) แผงที่ 4 เป็นสีฟ้าอ่อน หัวข้อ "4 字节级分词" (การทำ Tokenization ระดับไบต์) มีคำบรรยายใต้หัวข้อว่า "将字词转为字节编码,根据转换后的内容进行组合和划分" (แปลงคำเป็นรหัสไบต์ แล้วจัดกลุ่มและแบ่งตามเนื้อหาที่แปลงแล้ว) และแสดงฟองสบู่รหัสวงกลมเล็ก ๆ 14 วง: "E7", "A8", "8B", "...", "66", "74", "E4", "BA", "BA", "E8", "83", "BD", "..." เรียงเป็นหลายแถวเหมือนไบต์ที่ถูกเข้ารหัส ที่ด้านล่างให้แสดงมาสคอต Token สีฟ้าอีกครั้งพร้อมรอยยิ้มและกรอบคำพูดว่า "适合处理任意文本!" (เหมาะสำหรับการประมวลผลข้อความทุกรูปแบบ!) พร้อมลายเส้นดูเดิลรูปหลอดไฟเล็ก ๆ อยู่ใกล้ ๆ ที่ด้านล่างสุด ให้วางแบนเนอร์โน้ตขอบมนที่เขียนว่า "不同分词方式各有优势,实际应用中会根据任务和数据选择合适的方案哦!" (วิธีการทำ Tokenization แต่ละแบบมีข้อดีต่างกัน ในการใช้งานจริงจะเลือกวิธีที่เหมาะสมตามงานและข้อมูลนะ!) ใช้สีเขียวมิ้นต์ เหลือง ชมพู และฟ้าแบบพาสเทลสำหรับแผงทั้ง 4 ใช้ข้อความลายมือสีน้ำตาลเข้ม มีเงาจาง ๆ รูปทรงขอบมน และแสดงสีหน้าแบบคาวาอี้ที่น่ารักตลอดทั้งภาพ จัดองค์ประกอบให้สมดุล สะอาดตา และดูเป็นมิตร เหมือนโปสเตอร์อธิบายความรู้ทางวิทยาศาสตร์บนโซเชียลมีเดียที่ดูเป็นมืออาชีพ