Una infografía técnica detallada que compara lado a lado las arquitecturas transformer de DeepSeek V3/R1 y DeepSeek V4, ideal para publicaciones en redes sociales, presentaciones o visualizaciones de análisis de modelos.
{"type":"infografía comparativa de arquitectura de IA lado a lado","style":"diagrama técnico limpio, fondo blanco, contornos negros finos, rectángulos redondeados, cuadros de texto discontinuos, resaltados codificados por colores, estética de Slides de presentación, infografía vectorial","canvas":{"aspect_ratio":"2:1","resolution":"horizontal ancho"},"title_row":{"left_title":"DeepSeek V3/R1 (671 mil millones)","right_title":"DeepSeek V4 (1.2 billones)","left_title_color":"naranja-rojo brillante","right_title_color":"azul brillante"},"layout":{"columns":2,"sections":[{"title":"DeepSeek V3/R1 (671 mil millones)","position":"mitad izquierda","count":9,"labels":["Tamaño del vocabulario de 129k","Módulo FeedForward (SwiGLU)","Dimensión de la capa oculta intermedia de 2,048","Capa MoE","Longitud de contexto admitida de 128k tokens","Los primeros 3 bloques usan FFN denso con tamaño oculto de 18,432 en lugar de MoE","Texto de entrada de muestra","Dimensión de embedding de 7,168","128 cabezales"]},{"title":"DeepSeek V4 (1.2 billones)","position":"mitad derecha","count":9,"labels":["Tamaño del vocabulario de 160k","Módulo FeedForward (SwiGLU)","Dimensión de la capa oculta intermedia de 3,072","Capa MoE","Longitud de contexto admitida de 256k tokens","Los primeros 3 bloques usan FFN denso con tamaño oculto de 24,576 en lugar de MoE","Texto de entrada de muestra","Dimensión de embedding de 8,192","128 cabezales"]},{"title":"tabla comparativa inferior","position":"inferior ancho completo","count":10,"labels":["Parámetros totales","Parámetros activos por token","Tamaño oculto","Diseño de muestra","DeepSeek V3/R1","Intermedio (FF)","Cabezales de atención","Longitud de contexto","Dimensión de embedding","Tamaño del vocabulario"]}]},"left_panel":{"background":"rectángulo redondeado gris muy claro","main_stack":{"count":8,"blocks":["Texto tokenizado","Capa de embedding de tokens","RMSNorm 1","Atención latente de múltiples cabezales","RMSNorm 2","MoE","RMSNorm final","Capa de salida lineal"]},"side_module":"RoPE adjunto al bloque de atención en el lado izquierdo","attention_block":{"label":"Atención latente de múltiples cabezales","accent":"texto naranja-rojo para la palabra Latente"},"feedforward_inset":{"title":"Módulo FeedForward (SwiGLU)","count":4,"blocks":["Capa lineal","Activación SiLU","Capa lineal","Capa lineal"],"diagram":"dos ramas multiplicadas, luego proyectadas"},"moe_inset":{"title":"Capa MoE","count":5,"blocks":["nodo de combinación superior","Feed forward","Feed forward","Router","insignia de conteo de expertos 256"],"details":"pequeño cuadrado negro con 1 experto seleccionado, flechas dirigidas hacia los expertos, línea divisoria punteada"},"annotations":{"vocab":"Tamaño del vocabulario de 129k","ff_dim":"Dimensión de la capa oculta intermedia de 2,048","context":"Longitud de contexto admitida de 128k tokens","dense_first_blocks":"Los primeros 3 bloques usan FFN denso con tamaño oculto de 18,432 en lugar de MoE","resource_savings":"Ahorro de recursos: El tamaño del modelo es 671B pero solo 1 (compartido) + 8 expertos activos por token; solo 37B de parámetros están activos por paso de inferencia"},"bottom_stats":{"count":10,"items":["Parámetros totales: 671B","Parámetros activos por token: 37B (1 + 8 expertos)","Tamaño oculto: 7,128","Diseño de muestra: 28,432","Intermedio (FF): 2,048","Cabezales de atención: 128","Longitud de contexto: 128k","Dimensión de embedding: Primeros 3 bloques","Longitud de contexto ler: 22G7","Tamaño del vocabulario: 129k"]}},"right_panel":{"background":"rectángulo redondeado azul muy claro","main_stack":{"count":8,"blocks":["Texto tokenizado","Capa de embedding de tokens","RMSNorm 1","Atención latente de múltiples cabezales","RMSNorm 2","MoE","RMSNorm final","Capa de salida lineal"]},"side_module":"RoPE adjunto al bloque de atención en el lado izquierdo","attention_block":{"label":"Atención latente de múltiples cabezales","accent":"texto azul para la palabra Latente"},"feedforward_inset":{"title":"Módulo FeedForward (SwiGLU)","count":4,"blocks":["Capa lineal","Activación SiLU","Capa lineal","Capa lineal"],"diagram":"misma estructura que el panel izquierdo"},"moe_inset":{"title":"Capa MoE","count":5,"blocks":["nodo de combinación superior","Feed forward","Feed forward","Router","insignia de conteo de expertos 384"],"details":"pequeño cuadrado negro con 1 experto seleccionado, flechas dirigidas hacia los expertos, línea divisoria punteada, énfasis de borde azul"},"annotations":{"vocab":"Tamaño del vocabulario de 160k","ff_dim":"Dimensión de la capa oculta intermedia de 3,072","context":"Longitud de contexto admitida de 256k tokens","dense_first_blocks":"Los primeros 3 bloques usan FFN denso con tamaño oculto de 24,576 en lugar de MoE","resource_savings":"Ahorro de recursos: El tamaño del modelo es 1.2T pero solo 1 (compartido) + 8 expertos activos por token; solo 52B de parámetros están activos por paso de inferencia"},"bottom_stats":{"count":10,"items":["Parámetros totales: 1.2T","Parámetros activos por token: 52B (1 + 8 expertos)","Tamaño oculto: 7,2B","Diseño de muestra: 28,432","Intermedio (FF): 3,072","Cabezales de atención: 128","Longitud de contexto: 256k","Dimensión de embedding: Primeros 3 bloques","Longitud de contexto ler: 22G7","Tamaño del vocabulario: 160k"]}},"global_notes":"Cree un diagrama de comparación de arquitectura transformer altamente detallado con diseños reflejados. Cada mitad contiene un diagrama de pila de modelo grande más 2 diagramas insertados: 1 módulo feedforward y 1 capa MoE. Use flechas entre bloques, etiquetas técnicas pequeñas y líneas conectoras desde las etiquetas hasta los componentes relevantes. Mantenga la tipografía densa y similar a una diapositiva, con naranja-rojo usado para todo el énfasis de V3/R1 y azul usado para todo el énfasis de V4. Incluya una pequeña fila inferior de métricas tabulares compactas que abarquen todo el ancho. Preserve el aspecto de infografía ligeramente imperfecta y hecha por humanos con texto muy pequeño y anotaciones abarrotadas."}