मस्क हैरान! DeepSeek और Kimi ने ट्रांसफॉर्मर्स के "अनकहे नियमों" को तोड़ा

मस्क हैरान! DeepSeek और Kimi ने ट्रांसफॉर्मर्स के "अनकहे नियमों" को तोड़ा

@AlchainHust
चीनी2 माह पहले · 16 मार्च 2026

AI features

880K
768
153
33
0

TL;DR

Kimi का नया अटेंशन रेजिडुअल्स (AttnRes) लेयर्स को गतिशील रूप से पिछले आउटपुट तक पहुँचने की अनुमति देता है, जिससे सूचना हानि (information loss) की पुरानी समस्या हल हो गई है और यह DeepSeek के हालिया mHC दृष्टिकोण से बेहतर प्रदर्शन कर रहा है।

More patterns to decode

Recent viral articles

Explore more viral articles

क्रिएटर्स के लिए बनाया गया।

𝕏 के वायरल लेखों से content ideas खोजें, समझें कि वे क्यों चले, और उन patterns को अपने अगले creator-ready angle में बदलें.

Explore more viral articles