ช่องว่างที่แท้จริงของ AI จีนอาจกำลังกว้างขึ้น: มุมมองจากอดีตนักวิจัยของ ByteDance

การเปิดตัว DeepSeek V4 ไม่ได้สร้างกระแสคลั่งไคล้เหมือนปีที่แล้ว อันที่จริง เมื่อเทียบกับ Claude Sonnet 4.5 ที่เปิดตัวเมื่อหกเดือนก่อน ความสามารถของทั้งคู่ก็อยู่ในระดับที่ใกล้เคียงกัน แต่ช่องว่างกลับกว้างกว่าหกเดือนมาก เพราะ Sonnet 4.5 ถูกมองว่าเป็นเพียงรุ่นระดับสองเมื่อครึ่งปีก่อน อย่างไรก็ตาม ในบทความบนโซเชียลมีเดีย เรามักจะเห็นโมเดลภาษาขนาดใหญ่ของจีนสร้างข้อมูลเกณฑ์มาตรฐานที่สวยงามขึ้นเรื่อยๆ พร้อมกับคำกล่าวอ้างที่ว่า "ตามหลังแค่หกเดือน" หรือ "ตามทันแล้ว" ซึ่งได้ยินกันไปทั่ว

สถานการณ์จริงของช่องว่างด้าน AI ระหว่างจีนและสหรัฐฯ เป็นอย่างไร?

ในวันที่ 22 เมษายน ในพอดแคสต์ "Into Asia" จาง ชี ผู้ช่วยศาสตราจารย์ด้าน AI จากมหาวิทยาลัยปักกิ่ง ได้เปิดเผยความจริงตามที่เขาเห็น จาง ชี ปัจจุบันเป็นผู้ช่วยศาสตราจารย์ที่มหาวิทยาลัยปักกิ่ง และเพิ่งลาออกจากทีมโมเดลภาษาขนาดใหญ่หลักของ ByteDance (Seed LLM)

ในฐานะนักวิจัยและพัฒนาที่เคยทำงานแนวหน้าของบริษัทเทคโนโลยียักษ์ใหญ่ การประเมิน AI ในประเทศปัจจุบันของเขาค่อนข้างรุนแรง:

"ผมไม่เห็นด้วยกับมุมมองที่ว่าโมเดลของจีนกำลังตามทัน ผมเชื่อว่าเรายังตามหลังอยู่มาก และช่องว่างนี้อาจกำลังขยายกว้างขึ้น"

▸ ความเจริญรุ่งเรืองที่หลอกลวง: ทุกคน "สอนเพื่อสอบ" แต่ขาดการปฏิบัติจริง

ภายนอก โมเดลจากบริษัทเทคโนโลยียักษ์ใหญ่ต่าง ๆ กำลังแข่งขันกันอย่างดุเดือดบนเกณฑ์มาตรฐานต่าง ๆ โดยมีคะแนนพุ่งสูงขึ้นเป็นประวัติการณ์ แต่ภายใน นี่เป็นเพียง "การศึกษาแบบสอบ" ขนาดใหญ่สำหรับโมเดลภาษา

จาง ชี เปิดเผยในการสัมภาษณ์ว่าภายใน ByteDance (และเขาสงสัยว่าบริษัทเทคโนโลยียักษ์ใหญ่อื่น ๆ ก็คล้ายกัน) บรรยากาศการทำงานค่อนข้าง "สบาย" (พักเที่ยงสองชั่วโมงและเวลาทำงานจริงประมาณ 9 ชั่วโมงต่อวัน) แต่ทุกคนต้องเผชิญกับแรงกดดัน KPI โดยนัย นั่นคือ การเพิ่มคะแนนเกณฑ์มาตรฐาน (Bench-maxing)

ผู้บริหารให้ความสำคัญอย่างมากกับคะแนนของโมเดลบนลีดเดอร์บอร์ดเฉพาะ หากโมดูลที่คุณรับผิดชอบไม่ตรงกับคะแนนของโมเดลชั้นนำของสหรัฐฯ ผลการประเมินประสิทธิภาพของคุณจะดูแย่มาก

ผลลัพธ์: ข้อมูลบนกระดาษสวยงามมาก แต่เมื่อนำไปใช้ในแอปพลิเคชันจริงที่ซับซ้อน ประสบการณ์กลับน่าผิดหวัง

▸ เหวแห่งพลังประมวลผลและโครงสร้างพื้นฐาน: สามเดือนสำหรับพวกเขา อาจเป็นครึ่งปีสำหรับเรา

ข้อจำกัดด้านฮาร์ดแวร์เป็นเรื่องเก่า แต่ปฏิกิริยาลูกโซ่ที่เกิดขึ้นนั้นลึกซึ้งเกินกว่าที่เราจะจินตนาการ

ปัจจุบัน ส่วนใหญ่ของสิ่งที่บริษัทยักษ์ใหญ่ในประเทศใช้ฝึกโมเดลหลักของตนยังคงเป็นชิป NVIDIA ที่กักตุนไว้ก่อนการคว่ำบาตร หรือรุ่นพิเศษ H20 ที่เป็นไปตามข้อกำหนด โชคดีที่เริ่มต้นด้วย DeepSeek V4 มีการเปลี่ยนไปใช้การ์ดกราฟิก Huawei Ascend อย่างเต็มรูปแบบ ซึ่งคาดว่าจะช่วยปรับปรุงระบบนิเวศการฝึกในประเทศ

แต่ช่องว่างด้านพลังประมวลผลได้สะท้อนให้เห็นโดยตรงใน "ความเร็วในการทำซ้ำ" แล้ว

จาง ชี กล่าวถึงข่าวลือในอุตสาหกรรมว่า Google อาจใช้เวลาเพียง 3 เดือนในการฝึกก่อนและหลังการฝึกโมเดลภาษาขนาดใหญ่ครบหนึ่งรอบ สำหรับบริษัทยักษ์ใหญ่ในประเทศ ซึ่งถูกจำกัดด้วยขนาดของพลังประมวลผลและโครงสร้างพื้นฐาน วงจรนี้อาจยาวนานถึงครึ่งปี

สิ่งที่ซ่อนเร้นยิ่งกว่าคือช่องว่างใน โครงสร้างพื้นฐาน (Infra) จาง ชี ซึ่งเคยฝึกงานที่ Google คร่ำครวญว่าโครงสร้างพื้นฐานเบื้องล่างที่นั่นทำได้ดีมากจนนักวิจัย只需เขียนโค้ดบนอินเทอร์เฟซกราฟิกที่ราบรื่น โดยไม่ต้องกังวลเกี่ยวกับสถาปัตยกรรมเบื้องล่าง ในบริษัทเทคโนโลยียักษ์ใหญ่ในประเทศ การฝึกมักจะค้างหรือแสดงข้อผิดพลาด ต้นทุนความเสียดทานเหล่านี้กำลังทำให้ก้าวของการตามทันช้าลงอย่างมองไม่เห็น

▸ "ผู้ใช้ทั้งหมดใช้โมเดลของสหรัฐฯ แล้วเราจะได้ข้อมูลจากไหนมาปรับปรุง?"

หากพลังประมวลผลเป็นดาบเล่มแรกที่แขวนอยู่เหนือ AI ของจีน ในมุมมองของจาง ชี ดาบเล่มที่สอง—และปัจจุบันเป็นปัญหาที่แก้ไขได้ยากที่สุด—คือการแตกหักของ "วงล้อข้อมูล"

เขาให้ข้อมูลเชิงลึกที่เฉียบคมมากในการสัมภาษณ์: โมเดลชั้นนำของสหรัฐฯ ได้สร้างวงจรเชิงบวกที่ยากจะเอาชนะอย่างยิ่ง GPT และ Claude มีฐานผู้ใช้ทั่วโลกจำนวนมหาศาล ผู้ใช้เหล่านี้ใช้โมเดลในการทำงานจริงและกด "ถูกใจ" หรือ "ไม่ถูกใจ" ผลลัพธ์ ข้อเสนอแนะคุณภาพสูงนี้ประกอบเป็นข้อมูลการฝึกที่มีค่าที่สุดสำหรับสถานการณ์จริง

ในทางตรงกันข้าม เนื่องจากช่องว่างด้านความสามารถพื้นฐานที่เป็นรูปธรรม ผู้ใช้ที่มีมูลค่าสูงซึ่งต้องการความช่วยเหลือจาก AI มากที่สุด—เช่น โปรแกรมเมอร์และนักวิจัยตัวยง—กำลัง "ย้ายออก" กันเป็นจำนวนมาก

"ตอนนี้ผมใช้ Claude Code และ Cursor ในการเขียนโปรแกรมเป็นหลัก" จาง ชี กล่าวอย่างตรงไปตรงมา "ผมถึงกับรู้สึกว่าไม่จำเป็นต้องจ้างนักศึกษาปริญญาเอกจำนวนมากมาช่วยผมอีกแล้ว ผมสามารถปฏิบัติต่อ Claude Code และ Cursor เหมือนเป็นนักเรียนของผมได้เลย ผมสามารถสอนพวกเขาและสั่งให้พวกเขาทำสิ่งที่ผมต้องการ แต่ผมก็รู้สึกขัดแย้งเช่นกัน: ถ้าคนรุ่นผมไม่ฝึกคนรุ่นใหม่ ใครจะสานต่องานวิจัยเมื่อผมแก่?"

ทางเลือกในชีวิตประจำวันของนักวิทยาศาสตร์ AI ชั้นนำของจีนคนนี้สะท้อนให้เห็นความจริงที่เย็นชา: เมื่อนักพัฒนาชาวจีนชั้นนำที่ควรจะป้อนข้อมูลข้อเสนอแนะให้กับโมเดลในประเทศ กลับใช้โมเดลของสหรัฐฯ เพื่อเพิ่มประสิทธิภาพ แล้วบริษัทโมเดลภาษาขนาดใหญ่ของจีนจะได้รับข้อมูลปฏิสัมพันธ์คุณภาพสูงเพื่อเพิ่มประสิทธิภาพการเขียนโปรแกรมและความสามารถในการใช้เหตุผลจากที่ไหน?

▸ ราคาของการลัด: "ปัญญาประดิษฐ์ที่กลั่น" ไม่มีจิตวิญญาณ

หากไม่มีเวลาขัดเกลาโครงสร้างพื้นฐานและต้องเผชิญกับแรงกดดันเร่งด่วนในการตาม KPI บริษัทยักษ์ใหญ่ในประเทศทำอย่างไร?

คำตอบคือคำเดียว: การกลั่น (Distillation)

หากคุณต้องการฝึกโมเดลที่มีความฉลาดสูง วิธีที่แข็งแกร่งที่สุดคือการจ้างผู้เชี่ยวชาญในอุตสาหกรรมที่มีความเป็นมืออาชีพสูงมาเขียนข้อมูลการใช้เหตุผลคุณภาพสูงทีละบรรทัด ซึ่งทั้งแพงและใช้เวลานาน

แต่มีทางลัด: ถาม GPT, Claude หรือ Gemini โดยตรง เมื่อได้คำตอบและกระบวนการใช้เหตุผลที่ถูกต้องแล้ว ก็คัดลอกและป้อนให้กับโมเดลของคุณเอง สิ่งนี้เรียกว่า "การกลั่น" ในวงการ AI—โดยพื้นฐานแล้วคือการลอกการบ้านของนักเรียนหัวกะทิ

จาง ชี ยอมรับว่าเราอาจเป็นเลิศระดับโลกในเทคโนโลยี "การกลั่น" อยู่แล้ว แต่สิ่งนี้อาจไม่แปลเป็นข้อได้เปรียบที่แท้จริงในระยะยาว การลอกการบ้านช่วยให้คุณเปลี่ยนจากสอบตกเป็นสอบผ่าน หรือแม้กระทั่งได้คะแนน 80 ได้อย่างรวดเร็ว แต่คุณไม่มีวันเป็นนักเรียนหัวกะทิที่แท้จริงได้ด้วยการลอก

เพราะคุณขาดไปป์ไลน์ข้อมูลเชิงลึกของตนเอง เมื่อโมเดลต่างประเทศเริ่มวิวัฒนาการอย่างอิสระ "ทางลัด" กลับกลายเป็นโซ่ตรวนที่ผูกมัดความสามารถดั้งเดิมของเรา

▸ ความมั่นใจเดียวที่เหลืออยู่: ฮาร์ดแวร์และความฝันของ "AI ที่มีร่างกาย"

แม้จะมองโลกในแง่ร้ายอย่างมากเกี่ยวกับโอกาสในการตามทันในโมเดลภาษาขนาดใหญ่บริสุทธิ์ จาง ชี ยังคงชี้ให้เห็นข้อได้เปรียบเชิงโครงสร้างบางประการในระบบนิเวศ AI ของจีน

ในมุมมองของเขา ข้อได้เปรียบอยู่ที่ การผลิต เขากล่าวถึง Unitree ซึ่งเพิ่งจุดประเด็นถกเถียงในที่สาธารณะ โดยเชื่อว่าจีนมีความสามารถในการแข่งขันระดับโลกในด้านร่างกายฮาร์ดแวร์และการควบคุมการเคลื่อนไหวของมอเตอร์ สำหรับ "AI ที่มีร่างกาย" ที่กำลังเป็นที่นิยมในขณะนี้ มุมมองของจาง ชี คือ หากโมเดลภาษาของคุณใช้สำหรับงานที่ค่อนข้างง่ายเท่านั้น (เช่น การหยิบจับวัตถุ) ความสามารถของโมเดลภาษาขนาดใหญ่ของจีนที่มีอยู่ก็ "ดีพอแล้ว"

แต่เขาก็สาดน้ำเย็นเช่นกัน: ปัจจุบัน ผู้ผลิตหุ่นยนต์ส่วนใหญ่ยังคงติดอยู่ในขั้นตอน "การควบคุมการเคลื่อนไหว" และยังไม่ได้ใส่ปัญญาเข้าไปในสมองของหุ่นยนต์อย่างแท้จริง เมื่อต้องเกี่ยวข้องกับการใช้เหตุผลที่ซับซ้อนและ "การจัดการที่คล่องแคล่ว" ในวงกว้าง เรามีแนวโน้มที่จะชนเพดานเดียวกันกับที่โมเดลภาษาขนาดใหญ่กำลังเผชิญอยู่ในปัจจุบัน

▸ อนาคต?

ชิปที่จำกัด ไปป์ไลน์ข้อมูลที่อ่อนแอ โครงสร้างพื้นฐานที่ล้าหลัง การขาดวงจรป้อนกลับของผู้ใช้ และการพึ่งพาการกลั่นมากเกินไป—ปัญหาเหล่านี้รวมกันไม่สามารถแก้ไขได้ด้วยความก้าวหน้าทางเทคนิคเพียงครั้งเดียว โชคดีที่ DeepSeek V4 ปรับให้เข้ากับการ์ดกราฟิกในประเทศได้อย่างเต็มที่ แม้ว่าความสามารถโดยรวมจะตามหลังอยู่บ้าง แต่ก็ยังมีความหวังที่จะตามทันเมื่อระบบนิเวศสมบูรณ์แบบ และไม่ต้องพึ่งพาการกลั่น

ลิงก์พอดแคสต์ต้นฉบับ: [https://www.buzzsprout.com/2546300/episodes/19057945-a-year-inside-bytedance-s-ai-lab](https://www.buzzsprout.com/2546300/episodes/19057945-a-year-inside-bytedance-s-ai-lab)

▸ ความเจริญรุ่งเรืองที่หลอกลวง: ทุกคน "สอนเพื่อสอบ" แต่ขาดการปฏิบัติจริง

▸ เหวแห่งพลังประมวลผลและโครงสร้างพื้นฐาน: สามเดือนสำหรับพวกเขา อาจเป็นครึ่งปีสำหรับเรา

▸ "ผู้ใช้ทั้งหมดใช้โมเดลของสหรัฐฯ แล้วเราจะได้ข้อมูลจากไหนมาปรับปรุง?"

▸ ราคาของการลัด: "ปัญญาประดิษฐ์ที่กลั่น" ไม่มีจิตวิญญาณ

▸ ความมั่นใจเดียวที่เหลืออยู่: ฮาร์ดแวร์และความฝันของ "AI ที่มีร่างกาย"

▸ อนาคต?

Use YouMind to read viral articles deeply

บทความไวรัลล่าสุด

Wiki Memory

Let It Crash: วิธีรับมือกับสิ่งที่จะเกิดขึ้นหลังจากนั้น

เบสบอลกำลังเผชิญวิกฤต และทุกคนต่างก็รู้ดี

I Made My Hermes Agent 10x Faster Without Changing the Model

อัปเดต Tokenomics

Claude ช่วยให้เราทำเงินได้ 30,000 ดอลลาร์ใน 4 วัน (กรณีศึกษา)