
Musk Hayran Kaldı! DeepSeek ve Kimi, Transformer'ların "Yazılı Olmayan Kurallarını" Yıkıyor
AI features
- Views
- 880K
- Likes
- 768
- Reposts
- 153
- Comments
- 33
- Bookmarks
- 0
TL;DR
Kimi'nin yeni Attention Residuals (AttnRes) teknolojisi, katmanların önceki çıktılara dinamik olarak erişmesini sağlayarak uzun süredir devam eden bilgi kaybı sorunlarını çözüyor ve DeepSeek'in yakın zamandaki mHC yaklaşımından daha üstün bir performans sergiliyor.
Reading the TÜRKÇE translation


