¡Musk asombrado! DeepSeek y Kimi rompen las "reglas no escritas" de los Transformers

¡Musk asombrado! DeepSeek y Kimi rompen las "reglas no escritas" de los Transformers

@AlchainHust
CHINOhace 2 meses · 16 mar 2026

AI features

880K
768
153
33
0

TL;DR

Los nuevos Attention Residuals (AttnRes) de Kimi permiten que las capas accedan dinámicamente a las salidas anteriores, resolviendo problemas persistentes de pérdida de información y superando el reciente enfoque mHC de DeepSeek.

More patterns to decode

Recent viral articles

Explore more viral articles

Creado para creadores.

Encuentra ideas en artículos virales de 𝕏, descubre por qué funcionaron y convierte esos patrones en tu próximo ángulo de contenido.

Explore more viral articles