Musk ทึ่ง! DeepSeek และ Kimi ทลาย "กฎเหล็ก" ของ Transformers

Musk ทึ่ง! DeepSeek และ Kimi ทลาย "กฎเหล็ก" ของ Transformers

@AlchainHust
จีน2 เดือนที่ผ่านมา · 16 มี.ค. 2569

AI features

880K
768
153
33
0

TL;DR

Attention Residuals (AttnRes) รูปแบบใหม่ของ Kimi ช่วยให้แต่ละเลเยอร์สามารถเข้าถึงเอาต์พุตก่อนหน้าได้อย่างยืดหยุ่น ซึ่งช่วยแก้ปัญหาการสูญเสียข้อมูลที่มีมาอย่างยาวนาน และทำผลงานได้เหนือกว่าแนวทาง mHC ล่าสุดของ DeepSeek

More patterns to decode

Recent viral articles

Explore more viral articles

สร้างมาเพื่อครีเอเตอร์

หาไอเดียจากบทความไวรัลบน 𝕏 ถอดรหัสว่าทำไมถึงปัง แล้วเปลี่ยนแพตเทิร์นเหล่านั้นเป็นหัวข้อคอนเทนต์ถัดไปของคุณ

Explore more viral articles