การเปิดตัว DeepSeek V4 ไม่ได้สร้างกระแสคลั่งไคล้เหมือนปีที่แล้ว อันที่จริง เมื่อเทียบกับ Claude Sonnet 4.5 ที่เปิดตัวเมื่อหกเดือนก่อน ความสามารถของทั้งคู่ก็อยู่ในระดับที่ใกล้เคียงกัน แต่ช่องว่างกลับกว้างกว่าหกเดือนมาก เพราะ Sonnet 4.5 ถูกมองว่าเป็นเพียงรุ่นระดับสองเมื่อครึ่งปีก่อน อย่างไรก็ตาม ในบทความบนโซเชียลมีเดีย เรามักจะเห็นโมเดลภาษาขนาดใหญ่ของจีนสร้างข้อมูลเกณฑ์มาตรฐานที่สวยงามขึ้นเรื่อยๆ พร้อมกับคำกล่าวอ้างที่ว่า "ตามหลังแค่หกเดือน" หรือ "ตามทันแล้ว" ซึ่งได้ยินกันไปทั่ว
สถานการณ์จริงของช่องว่างด้าน AI ระหว่างจีนและสหรัฐฯ เป็นอย่างไร?
ในวันที่ 22 เมษายน ในพอดแคสต์ "Into Asia" จาง ชี ผู้ช่วยศาสตราจารย์ด้าน AI จากมหาวิทยาลัยปักกิ่ง ได้เปิดเผยความจริงตามที่เขาเห็น จาง ชี ปัจจุบันเป็นผู้ช่วยศาสตราจารย์ที่มหาวิทยาลัยปักกิ่ง และเพิ่งลาออกจากทีมโมเดลภาษาขนาดใหญ่หลักของ ByteDance (Seed LLM)
ในฐานะนักวิจัยและพัฒนาที่เคยทำงานแนวหน้าของบริษัทเทคโนโลยียักษ์ใหญ่ การประเมิน AI ในประเทศปัจจุบันของเขาค่อนข้างรุนแรง:
"ผมไม่เห็นด้วยกับมุมมองที่ว่าโมเดลของจีนกำลังตามทัน ผมเชื่อว่าเรายังตามหลังอยู่มาก และช่องว่างนี้อาจกำลังขยายกว้างขึ้น"
▸ ความเจริญรุ่งเรืองที่หลอกลวง: ทุกคน "สอนเพื่อสอบ" แต่ขาดการปฏิบัติจริง
ภายนอก โมเดลจากบริษัทเทคโนโลยียักษ์ใหญ่ต่าง ๆ กำลังแข่งขันกันอย่างดุเดือดบนเกณฑ์มาตรฐานต่าง ๆ โดยมีคะแนนพุ่งสูงขึ้นเป็นประวัติการณ์ แต่ภายใน นี่เป็นเพียง "การศึกษาแบบสอบ" ขนาดใหญ่สำหรับโมเดลภาษา
จาง ชี เปิดเผยในการสัมภาษณ์ว่าภายใน ByteDance (และเขาสงสัยว่าบริษัทเทคโนโลยียักษ์ใหญ่อื่น ๆ ก็คล้ายกัน) บรรยากาศการทำงานค่อนข้าง "สบาย" (พักเที่ยงสองชั่วโมงและเวลาทำงานจริงประมาณ 9 ชั่วโมงต่อวัน) แต่ทุกคนต้องเผชิญกับแรงกดดัน KPI โดยนัย นั่นคือ การเพิ่มคะแนนเกณฑ์มาตรฐาน (Bench-maxing)
ผู้บริหารให้ความสำคัญอย่างมากกับคะแนนของโมเดลบนลีดเดอร์บอร์ดเฉพาะ หากโมดูลที่คุณรับผิดชอบไม่ตรงกับคะแนนของโมเดลชั้นนำของสหรัฐฯ ผลการประเมินประสิทธิภาพของคุณจะดูแย่มาก
ผลลัพธ์: ข้อมูลบนกระดาษสวยงามมาก แต่เมื่อนำไปใช้ในแอปพลิเคชันจริงที่ซับซ้อน ประสบการณ์กลับน่าผิดหวัง
▸ เหวแห่งพลังประมวลผลและโครงสร้างพื้นฐาน: สามเดือนสำหรับพวกเขา อาจเป็นครึ่งปีสำหรับเรา
ข้อจำกัดด้านฮาร์ดแวร์เป็นเรื่องเก่า แต่ปฏิกิริยาลูกโซ่ที่เกิดขึ้นนั้นลึกซึ้งเกินกว่าที่เราจะจินตนาการ
ปัจจุบัน ส่วนใหญ่ของสิ่งที่บริษัทยักษ์ใหญ่ในประเทศใช้ฝึกโมเดลหลักของตนยังคงเป็นชิป NVIDIA ที่กักตุนไว้ก่อนการคว่ำบาตร หรือรุ่นพิเศษ H20 ที่เป็นไปตามข้อกำหนด โชคดีที่เริ่มต้นด้วย DeepSeek V4 มีการเปลี่ยนไปใช้การ์ดกราฟิก Huawei Ascend อย่างเต็มรูปแบบ ซึ่งคาดว่าจะช่วยปรับปรุงระบบนิเวศการฝึกในประเทศ
แต่ช่องว่างด้านพลังประมวลผลได้สะท้อนให้เห็นโดยตรงใน "ความเร็วในการทำซ้ำ" แล้ว
จาง ชี กล่าวถึงข่าวลือในอุตสาหกรรมว่า Google อาจใช้เวลาเพียง 3 เดือนในการฝึกก่อนและหลังการฝึกโมเดลภาษาขนาดใหญ่ครบหนึ่งรอบ สำหรับบริษัทยักษ์ใหญ่ในประเทศ ซึ่งถูกจำกัดด้วยขนาดของพลังประมวลผลและโครงสร้างพื้นฐาน วงจรนี้อาจยาวนานถึงครึ่งปี
สิ่งที่ซ่อนเร้นยิ่งกว่าคือช่องว่างใน โครงสร้างพื้นฐาน (Infra) จาง ชี ซึ่งเคยฝึกงานที่ Google คร่ำครวญว่าโครงสร้างพื้นฐานเบื้องล่างที่นั่นทำได้ดีมากจนนักวิจัย只需เขียนโค้ดบนอินเทอร์เฟซกราฟิกที่ราบรื่น โดยไม่ต้องกังวลเกี่ยวกับสถาปัตยกรรมเบื้องล่าง ในบริษัทเทคโนโลยียักษ์ใหญ่ในประเทศ การฝึกมักจะค้างหรือแสดงข้อผิดพลาด ต้นทุนความเสียดทานเหล่านี้กำลังทำให้ก้าวของการตามทันช้าลงอย่างมองไม่เห็น
▸ "ผู้ใช้ทั้งหมดใช้โมเดลของสหรัฐฯ แล้วเราจะได้ข้อมูลจากไหนมาปรับปรุง?"
หากพลังประมวลผลเป็นดาบเล่มแรกที่แขวนอยู่เหนือ AI ของจีน ในมุมมองของจาง ชี ดาบเล่มที่สอง—และปัจจุบันเป็นปัญหาที่แก้ไขได้ยากที่สุด—คือการแตกหักของ "วงล้อข้อมูล"
เขาให้ข้อมูลเชิงลึกที่เฉียบคมมากในการสัมภาษณ์: โมเดลชั้นนำของสหรัฐฯ ได้สร้างวงจรเชิงบวกที่ยากจะเอาชนะอย่างยิ่ง GPT และ Claude มีฐานผู้ใช้ทั่วโลกจำนวนมหาศาล ผู้ใช้เหล่านี้ใช้โมเดลในการทำงานจริงและกด "ถูกใจ" หรือ "ไม่ถูกใจ" ผลลัพธ์ ข้อเสนอแนะคุณภาพสูงนี้ประกอบเป็นข้อมูลการฝึกที่มีค่าที่สุดสำหรับสถานการณ์จริง
ในทางตรงกันข้าม เนื่องจากช่องว่างด้านความสามารถพื้นฐานที่เป็นรูปธรรม ผู้ใช้ที่มีมูลค่าสูงซึ่งต้องการความช่วยเหลือจาก AI มากที่สุด—เช่น โปรแกรมเมอร์และนักวิจัยตัวยง—กำลัง "ย้ายออก" กันเป็นจำนวนมาก
"ตอนนี้ผมใช้ Claude Code และ Cursor ในการเขียนโปรแกรมเป็นหลัก" จาง ชี กล่าวอย่างตรงไปตรงมา "ผมถึงกับรู้สึกว่าไม่จำเป็นต้องจ้างนักศึกษาปริญญาเอกจำนวนมากมาช่วยผมอีกแล้ว ผมสามารถปฏิบัติต่อ Claude Code และ Cursor เหมือนเป็นนักเรียนของผมได้เลย ผมสามารถสอนพวกเขาและสั่งให้พวกเขาทำสิ่งที่ผมต้องการ แต่ผมก็รู้สึกขัดแย้งเช่นกัน: ถ้าคนรุ่นผมไม่ฝึกคนรุ่นใหม่ ใครจะสานต่องานวิจัยเมื่อผมแก่?"
ทางเลือกในชีวิตประจำวันของนักวิทยาศาสตร์ AI ชั้นนำของจีนคนนี้สะท้อนให้เห็นความจริงที่เย็นชา: เมื่อนักพัฒนาชาวจีนชั้นนำที่ควรจะป้อนข้อมูลข้อเสนอแนะให้กับโมเดลในประเทศ กลับใช้โมเดลของสหรัฐฯ เพื่อเพิ่มประสิทธิภาพ แล้วบริษัทโมเดลภาษาขนาดใหญ่ของจีนจะได้รับข้อมูลปฏิสัมพันธ์คุณภาพสูงเพื่อเพิ่มประสิทธิภาพการเขียนโปรแกรมและความสามารถในการใช้เหตุผลจากที่ไหน?
▸ ราคาของการลัด: "ปัญญาประดิษฐ์ที่กลั่น" ไม่มีจิตวิญญาณ
หากไม่มีเวลาขัดเกลาโครงสร้างพื้นฐานและต้องเผชิญกับแรงกดดันเร่งด่วนในการตาม KPI บริษัทยักษ์ใหญ่ในประเทศทำอย่างไร?
คำตอบคือคำเดียว: การกลั่น (Distillation)
หากคุณต้องการฝึกโมเดลที่มีความฉลาดสูง วิธีที่แข็งแกร่งที่สุดคือการจ้างผู้เชี่ยวชาญในอุตสาหกรรมที่มีความเป็นมืออาชีพสูงมาเขียนข้อมูลการใช้เหตุผลคุณภาพสูงทีละบรรทัด ซึ่งทั้งแพงและใช้เวลานาน
แต่มีทางลัด: ถาม GPT, Claude หรือ Gemini โดยตรง เมื่อได้คำตอบและกระบวนการใช้เหตุผลที่ถูกต้องแล้ว ก็คัดลอกและป้อนให้กับโมเดลของคุณเอง สิ่งนี้เรียกว่า "การกลั่น" ในวงการ AI—โดยพื้นฐานแล้วคือการลอกการบ้านของนักเรียนหัวกะทิ
จาง ชี ยอมรับว่าเราอาจเป็นเลิศระดับโลกในเทคโนโลยี "การกลั่น" อยู่แล้ว แต่สิ่งนี้อาจไม่แปลเป็นข้อได้เปรียบที่แท้จริงในระยะยาว การลอกการบ้านช่วยให้คุณเปลี่ยนจากสอบตกเป็นสอบผ่าน หรือแม้กระทั่งได้คะแนน 80 ได้อย่างรวดเร็ว แต่คุณไม่มีวันเป็นนักเรียนหัวกะทิที่แท้จริงได้ด้วยการลอก
เพราะคุณขาดไปป์ไลน์ข้อมูลเชิงลึกของตนเอง เมื่อโมเดลต่างประเทศเริ่มวิวัฒนาการอย่างอิสระ "ทางลัด" กลับกลายเป็นโซ่ตรวนที่ผูกมัดความสามารถดั้งเดิมของเรา
▸ ความมั่นใจเดียวที่เหลืออยู่: ฮาร์ดแวร์และความฝันของ "AI ที่มีร่างกาย"
แม้จะมองโลกในแง่ร้ายอย่างมากเกี่ยวกับโอกาสในการตามทันในโมเดลภาษาขนาดใหญ่บริสุทธิ์ จาง ชี ยังคงชี้ให้เห็นข้อได้เปรียบเชิงโครงสร้างบางประการในระบบนิเวศ AI ของจีน
ในมุมมองของเขา ข้อได้เปรียบอยู่ที่ การผลิต เขากล่าวถึง Unitree ซึ่งเพิ่งจุดประเด็นถกเถียงในที่สาธารณะ โดยเชื่อว่าจีนมีความสามารถในการแข่งขันระดับโลกในด้านร่างกายฮาร์ดแวร์และการควบคุมการเคลื่อนไหวของมอเตอร์ สำหรับ "AI ที่มีร่างกาย" ที่กำลังเป็นที่นิยมในขณะนี้ มุมมองของจาง ชี คือ หากโมเดลภาษาของคุณใช้สำหรับงานที่ค่อนข้างง่ายเท่านั้น (เช่น การหยิบจับวัตถุ) ความสามารถของโมเดลภาษาขนาดใหญ่ของจีนที่มีอยู่ก็ "ดีพอแล้ว"
แต่เขาก็สาดน้ำเย็นเช่นกัน: ปัจจุบัน ผู้ผลิตหุ่นยนต์ส่วนใหญ่ยังคงติดอยู่ในขั้นตอน "การควบคุมการเคลื่อนไหว" และยังไม่ได้ใส่ปัญญาเข้าไปในสมองของหุ่นยนต์อย่างแท้จริง เมื่อต้องเกี่ยวข้องกับการใช้เหตุผลที่ซับซ้อนและ "การจัดการที่คล่องแคล่ว" ในวงกว้าง เรามีแนวโน้มที่จะชนเพดานเดียวกันกับที่โมเดลภาษาขนาดใหญ่กำลังเผชิญอยู่ในปัจจุบัน
▸ อนาคต?
ชิปที่จำกัด ไปป์ไลน์ข้อมูลที่อ่อนแอ โครงสร้างพื้นฐานที่ล้าหลัง การขาดวงจรป้อนกลับของผู้ใช้ และการพึ่งพาการกลั่นมากเกินไป—ปัญหาเหล่านี้รวมกันไม่สามารถแก้ไขได้ด้วยความก้าวหน้าทางเทคนิคเพียงครั้งเดียว โชคดีที่ DeepSeek V4 ปรับให้เข้ากับการ์ดกราฟิกในประเทศได้อย่างเต็มที่ แม้ว่าความสามารถโดยรวมจะตามหลังอยู่บ้าง แต่ก็ยังมีความหวังที่จะตามทันเมื่อระบบนิเวศสมบูรณ์แบบ และไม่ต้องพึ่งพาการกลั่น
ลิงก์พอดแคสต์ต้นฉบับ: [https://www.buzzsprout.com/2546300/episodes/19057945-a-year-inside-bytedance-s-ai-lab](https://www.buzzsprout.com/2546300/episodes/19057945-a-year-inside-bytedance-s-ai-lab)





