สร้างภาพหน้าจอแชท AI ที่สมจริง โดยมีภาพอินโฟกราฟิกทางเทคนิคโทนสีน้ำเงิน-ขาวที่อธิบายการทำงานของโมเดลภาษาขนาดใหญ่
เป้าหมาย: สร้างภาพหน้าจอแชท AI ที่สมจริง โดยแสดงภาพอินโฟกราฟิกทางเทคนิคที่สร้างขึ้นเกี่ยวกับ วิธีการทำงานทางเทคนิคของโมเดลภาษาขนาดใหญ่ (LLMs) ภาพหน้าจอควรมีลักษณะเหมือนการสนทนาในเว็บแอปสมัยใหม่ ไม่ใช่ภาพโปสเตอร์เดี่ยวๆ
ผืนผ้าใบ: ภาพหน้าจอแนวตั้งขนาด 768×1024 พื้นหลังแอปสีเทาอ่อน พื้นที่เนื้อหาสีขาวขอบมน ตัวอักษรแบบไม่มีหัวที่สะอาดตา มีเงาจางๆ ความละเอียดสูงแต่ข้อความในอินโฟกราฟิกมีขนาดเล็กเล็กน้อยเหมือนภาพที่สร้างขึ้นและฝังอยู่ในแชทจริงๆ
เค้าโครง UI แชท: ที่ด้านซ้ายบนแสดงรูปโปรไฟล์ผู้ใช้แบบวงกลมเล็กๆ ชื่อแชท “Visualizing LLM Architecture” พร้อมลูกศรดรอปดาวน์ขนาดเล็ก และที่ด้านขวาบนแสดงป้าย “Files” พร้อมไอคอน ด้านล่างแสดงฟองข้อความของผู้ใช้แบบขอบมนจัดวางไว้ใกล้กึ่งกลาง/ขวาบน โดยมีข้อความ: “make an image explaining how LLMs work technically” ใต้ข้อความนั้น ให้แสดงแถบสถานะเล็กๆ ที่อ่านว่า “Scira task complete” พร้อมไอคอนประกายไฟ/ตัวโหลดและลูกศร ภาพหลักที่สร้างขึ้นจะปรากฏอยู่ด้านล่างในรูปแบบการ์ดสี่เหลี่ยมขอบมนขนาดใหญ่ ใต้ภาพให้ใส่ข้อความอธิบายของระบบว่า: “The image above is a comprehensive technical infographic breaking down how Large Language Models function under the hood. Here is a detailed walkthrough of each component shown:” ตามด้วยหัวข้อส่วนที่เน้นตัวหนา “Tokenization: From Text to Numbers” ที่ด้านล่างสุด ให้แสดงช่องป้อนข้อความแบบขอบมนพร้อมข้อความตัวอย่าง “Ask a follow-up...”, ปุ่มบวกทางด้านซ้าย, ตัวควบคุมเครื่องมือ/โมเดลขนาดเล็กทางด้านขวา, ป้ายชื่อโมเดล “Kimi K2.6” พร้อมดรอปดาวน์ และปุ่มเสียงแบบวงกลม
อินโฟกราฟิกที่สร้างขึ้นภายในแชท: ออกแบบโปสเตอร์ให้ความรู้ทางเทคนิคโทนสีน้ำเงิน-ขาว โดยมีชื่อหัวข้อเป็นตัวพิมพ์ใหญ่สีน้ำเงินเข้มว่า: “HOW LARGE LANGUAGE MODELS (LLMs) WORK” ใช้พื้นหลังสีขาว เส้นขอบสีน้ำเงินเข้ม ไฮไลต์สีฟ้าอ่อน แผงขอบมน ลูกศรเชื่อมโยงขั้นตอน แผนภูมิขนาดเล็ก สมการ ตาราง และไอคอน โปสเตอร์ควรมีความหนาแน่นของข้อมูลและเน้นความเป็นวิศวกรรม
ส่วนประกอบของอินโฟกราฟิก: ใช้แผง/พื้นที่ที่ระบุไว้ 8 ส่วนดังนี้:
1. แผง “INPUT: TOKENIZATION” แสดงกล่องข้อความดิบที่มีประโยค “The quick brown fox jumps over the lazy dog.”, บล็อกตัวตัดคำ (tokenizer), กล่องโทเค็นสำหรับคำต่างๆ และกล่องรหัสโทเค็น
2. แผง “EMBEDDINGS” แสดงรหัสโทเค็นที่ถูกแปลงเป็นเวกเตอร์ความหนาแน่นสูง พร้อมตารางค่าตัวเลข embedding ขนาดเล็ก
3. แผง “TRANSFORMER ARCHITECTURE” แสดงบล็อก transformer แบบซ้อนกันพร้อม Add & Norm, Feed-Forward Network, Multi-Head Self-Attention, input embeddings, positional encoding และสัญลักษณ์การทำซ้ำเลเยอร์
4A. แผง “SELF-ATTENTION MECHANISM (INSIDE ONE HEAD)” ด้านซ้ายล่างแบบกว้าง แสดงเมทริกซ์สำหรับ input embeddings, queries, keys, values, คะแนนความสนใจ (attention scores), softmax, ค่าน้ำหนักความสนใจ (attention weights), ผลรวมถ่วงน้ำหนัก และสมการต่างๆ
4B. แผง “ATTENTION: TOKENS ATTEND TO EACH OTHER” แสดงกราฟเครือข่ายของโทเค็นจากประโยคตัวอย่างที่เชื่อมต่อกันด้วยเส้นสีน้ำเงิน พร้อมแถบแสดงค่าน้ำหนักความสนใจ
5. แผง “OUTPUT: NEXT TOKEN PREDICTION” แสดงแถบการกระจายความน่าจะเป็นสำหรับโทเค็นถัดไปที่เป็นไปได้ เช่น cat, sat, on, the, mat, roof แล้วไฮไลต์โทเค็นถัดไปที่คาดการณ์ไว้คือ “the”
6. แผง “TRAINING: PRE-TRAINING WITH NEXT-TOKEN PREDICTION” แถบยาวด้านล่างแบ่งเป็น 5 การ์ดขนาดเล็ก: คลังข้อมูลข้อความขนาดใหญ่, การสร้างตัวอย่างการฝึกฝน, การคาดการณ์ของโมเดล, การคำนวณค่าความสูญเสีย (loss), และการทำ backpropagation/update
7. ลูกศรแสดงกระบวนการด้านล่างที่อ่านว่า “Repeat for billions of examples over many epochs until convergence.”
8. กล่องข้อความผลลัพธ์ด้านขวาล่างพร้อมไอคอนสมองที่อธิบายว่าโมเดลเรียนรู้รูปแบบภาษาและความรู้ทั่วไปอย่างไร
สไตล์ภาพ: อินโฟกราฟิกแบบเวกเตอร์ที่คมชัด ดูเป็นวิชาการแต่เป็นมิตร หัวข้อสีน้ำเงินเข้ม ขอบสีน้ำเงินปานกลาง เติมสีฟ้าอ่อน ตารางและแผนภูมิขนาดเล็ก ลูกศรที่สะอาดตา การ์ดขอบมน และระยะห่างที่สม่ำเสมอ ทำให้ภาพอินโฟกราฟิกที่ฝังอยู่ดูเหมือนแผนภาพการศึกษาที่สร้างโดย AI ซึ่งมีข้อความขนาดเล็กที่หนาแน่นแต่อ่านออกได้เป็นส่วนใหญ่
ข้อจำกัด: เก็บข้อความ UI ทั้งหมดเป็นภาษาอังกฤษ ห้ามใส่ลายน้ำ รักษาการจัดวางภาพหน้าจอแชทและภาพอินโฟกราฟิกขนาดใหญ่ที่ฝังอยู่ ใช้พื้นที่อินโฟกราฟิก 8 ส่วนตามที่ระบุไว้ และการ์ดขนาดเล็ก 5 ใบภายในแถบการฝึกฝนอย่างเคร่งครัด