Um infográfico técnico denso, comparando lado a lado as arquiteturas de transformadores do DeepSeek V3/R1 e DeepSeek V4, ideal para publicações em redes sociais, apresentações ou visuais de análise de modelos.
{"type":"infográfico de comparação lado a lado de arquitetura de IA","style":"diagrama técnico limpo, fundo branco, contornos pretos finos, retângulos arredondados, caixas de destaque tracejadas, destaques codificados por cores, estética de Slides de apresentação, infográfico vetorial","canvas":{"aspect_ratio":"2:1","resolution":"horizontal amplo"},"title_row":{"left_title":"DeepSeek V3/R1 (671 bilhões)","right_title":"DeepSeek V4 (1,2 trilhão)","left_title_color":"laranja-avermelhado brilhante","right_title_color":"azul brilhante"},"layout":{"columns":2,"sections":[{"title":"DeepSeek V3/R1 (671 bilhões)","position":"metade esquerda","count":9,"labels":["Tamanho do vocabulário de 129k","Módulo FeedForward (SwiGLU)","Dimensão da camada oculta intermediária de 2.048","Camada MoE","Comprimento de contexto suportado de 128k tokens","Os 3 primeiros blocos usam FFN denso com tamanho oculto de 18.432 em vez de MoE","Texto de entrada de exemplo","Dimensão de embedding de 7.168","128 cabeças"]},{"title":"DeepSeek V4 (1,2 trilhão)","position":"metade direita","count":9,"labels":["Tamanho do vocabulário de 160k","Módulo FeedForward (SwiGLU)","Dimensão da camada oculta intermediária de 3.072","Camada MoE","Comprimento de contexto suportado de 256k tokens","Os 3 primeiros blocos usam FFN denso com tamanho oculto de 24.576 em vez de MoE","Texto de entrada de exemplo","Dimensão de embedding de 8.192","128 cabeças"]},{"title":"tabela de comparação inferior","position":"largura total inferior","count":10,"labels":["Parâmetros totais","Parâmetros ativos por token","Tamanho oculto","Design de exemplo","DeepSeek V3/R1","Intermediário (FF)","Cabeças de atenção","Comprimento de contexto","Dimensão de embedding","Tamanho do vocabulário"]}]},"left_panel":{"background":"retângulo arredondado cinza muito claro","main_stack":{"count":8,"blocks":["Texto tokenizado","Camada de embedding de tokens","RMSNorm 1","Atenção latente multi-cabeça","RMSNorm 2","MoE","RMSNorm final","Camada de saída linear"]},"side_module":"RoPE anexado ao bloco de atenção no lado esquerdo","attention_block":{"label":"Atenção latente multi-cabeça","accent":"texto laranja-avermelhado para a palavra Latente"},"feedforward_inset":{"title":"Módulo FeedForward (SwiGLU)","count":4,"blocks":["Camada linear","Ativação SiLU","Camada linear","Camada linear"],"diagram":"dois ramos multiplicados, então projetados"},"moe_inset":{"title":"Camada MoE","count":5,"blocks":["nó de combinação superior","Feed forward","Feed forward","Roteador","crachá de contagem de especialistas 256"],"details":"pequeno quadrado preto com 1 especialista selecionado, setas roteando para cima para os especialistas, linha divisória pontilhada"},"annotations":{"vocab":"Tamanho do vocabulário de 129k","ff_dim":"Dimensão da camada oculta intermediária de 2.048","context":"Comprimento de contexto suportado de 128k tokens","dense_first_blocks":"Os 3 primeiros blocos usam FFN denso com tamanho oculto de 18.432 em vez de MoE","resource_savings":"Economia de recursos: O tamanho do modelo é 671B, mas apenas 1 (compartilhado) + 8 especialistas ativos por token; apenas 37B de parâmetros estão ativos por etapa de inferência"},"bottom_stats":{"count":10,"items":["Parâmetros totais: 671B","Parâmetros ativos por token: 37B (1 + 8 especialistas)","Tamanho oculto: 7.128","Design de exemplo: 28.432","Intermediário (FF): 2.048","Cabeças de atenção: 128","Comprimento de contexto: 128k","Dimensão de embedding: 3 primeiros blocos","Comprimento de contexto: 22G7","Tamanho do vocabulário: 129k"]}},"right_panel":{"background":"retângulo arredondado azul muito claro","main_stack":{"count":8,"blocks":["Texto tokenizado","Camada de embedding de tokens","RMSNorm 1","Atenção latente multi-cabeça","RMSNorm 2","MoE","RMSNorm final","Camada de saída linear"]},"side_module":"RoPE anexado ao bloco de atenção no lado esquerdo","attention_block":{"label":"Atenção latente multi-cabeça","accent":"texto azul para a palavra Latente"},"feedforward_inset":{"title":"Módulo FeedForward (SwiGLU)","count":4,"blocks":["Camada linear","Ativação SiLU","Camada linear","Camada linear"],"diagram":"mesma estrutura do painel esquerdo"},"moe_inset":{"title":"Camada MoE","count":5,"blocks":["nó de combinação superior","Feed forward","Feed forward","Roteador","crachá de contagem de especialistas 384"],"details":"pequeno quadrado preto com 1 especialista selecionado, setas roteando para cima para os especialistas, linha divisória pontilhada, ênfase na borda azul"},"annotations":{"vocab":"Tamanho do vocabulário de 160k","ff_dim":"Dimensão da camada oculta intermediária de 3.072","context":"Comprimento de contexto suportado de 256k tokens","dense_first_blocks":"Os 3 primeiros blocos usam FFN denso com tamanho oculto de 24.576 em vez de MoE","resource_savings":"Economia de recursos: O tamanho do modelo é 1.2T, mas apenas 1 (compartilhado) + 8 especialistas ativos por token; apenas 52B de parâmetros estão ativos por etapa de inferência"},"bottom_stats":{"count":10,"items":["Parâmetros totais: 1.2T","Parâmetros ativos por token: 52B (1 + 8 especialistas)","Tamanho oculto: 7.2B","Design de exemplo: 28.432","Intermediário (FF): 3.072","Cabeças de atenção: 128","Comprimento de contexto: 256k","Dimensão de embedding: 3 primeiros blocos","Comprimento de contexto: 22G7","Tamanho do vocabulário: 160k"]}},"global_notes":"Crie um diagrama de comparação de arquitetura de transformador altamente detalhado com layouts espelhados. Cada metade contém um diagrama de pilha de modelo grande mais 2 diagramas de inserção: 1 módulo feedforward e 1 camada MoE. Use setas entre os blocos, rótulos técnicos pequenos e linhas de conexão dos rótulos aos componentes relevantes. Mantenha a tipografia densa e com aspecto de Slides, com laranja-avermelhado usado para toda ênfase do V3/R1 e azul usado para toda ênfase do V4. Inclua uma pequena linha inferior de métricas tabulares compactas abrangendo a largura. Preserve o visual de infográfico feito à mão, levemente imperfeito, com texto muito pequeno e anotações aglomeradas."}