Musk impressionado! DeepSeek e Kimi quebram as "regras não ditas" dos Transformers

Musk impressionado! DeepSeek e Kimi quebram as "regras não ditas" dos Transformers

@AlchainHust
CHINÊShá 2 meses · 16/03/2026

AI features

880K
768
153
33
0

TL;DR

O novo Attention Residuals (AttnRes) do Kimi permite que as camadas acessem dinamicamente saídas anteriores, resolvendo problemas persistentes de perda de informação e superando a recente abordagem mHC do DeepSeek.

More patterns to decode

Recent viral articles

Explore more viral articles

Feito para criadores.

Encontre ideias em artigos virais no 𝕏, perceba porque funcionaram e transforme esses padrões no seu próximo ângulo de conteúdo.

Explore more viral articles