머스크도 놀랐다! DeepSeek와 Kimi, 트랜스포머의 '불문율'을 깨다

머스크도 놀랐다! DeepSeek와 Kimi, 트랜스포머의 '불문율'을 깨다

@AlchainHust
중국어2개월 전 · 2026년 3월 16일

AI features

880K
768
153
33
0

TL;DR

Kimi의 새로운 Attention Residuals(AttnRes)는 레이어가 이전 출력값에 동적으로 접근할 수 있게 하여, 고질적인 정보 손실 문제를 해결하고 DeepSeek의 최근 mHC 방식보다 뛰어난 성능을 보여줍니다.

More patterns to decode

Recent viral articles

Explore more viral articles

크리에이터를 위해.

𝕏의 바이럴 기사에서 콘텐츠 아이디어를 찾고, 왜 터졌는지 분석해 다음 크리에이터용 앵글로 바꿔보세요.

Explore more viral articles