Infográfico de Arquitetura: DeepSeek V3 vs V4

Um infográfico técnico detalhado comparando lado a lado as arquiteturas de transformadores DeepSeek V3/R1 e DeepSeek V4, ideal para posts em redes sociais, apresentações ou visuais de análise de modelos.

Comando
{"type":"infográfico de comparação de arquitetura de IA lado a lado","style":"diagrama técnico limpo, fundo branco, contornos pretos finos, retângulos arredondados, caixas de destaque tracejadas, destaques codificados por cores, estética de Slides de apresentação, infográfico vetorial","canvas":{"aspect_ratio":"2:1","resolution":"horizontal amplo"},"title_row":{"left_title":"DeepSeek V3/R1 (671 bilhões)","right_title":"DeepSeek V4 (1,2 trilhão)","left_title_color":"laranja-avermelhado brilhante","right_title_color":"azul brilhante"},"layout":{"columns":2,"sections":[{"title":"DeepSeek V3/R1 (671 bilhões)","position":"metade esquerda","count":9,"labels":["Tamanho do vocabulário de 129k","Módulo FeedForward (SwiGLU)","Dimensão da camada oculta intermediária de 2.048","Camada MoE","Comprimento de contexto suportado de 128k tokens","Primeiros 3 blocos usam FFN denso com tamanho oculto de 18.432 em vez de MoE","Texto de entrada de exemplo","Dimensão de embedding de 7.168","128 cabeças"]},{"title":"DeepSeek V4 (1,2 trilhão)","position":"metade direita","count":9,"labels":["Tamanho do vocabulário de 160k","Módulo FeedForward (SwiGLU)","Dimensão da camada oculta intermediária de 3.072","Camada MoE","Comprimento de contexto suportado de 256k tokens","Primeiros 3 blocos usam FFN denso com tamanho oculto de 24.576 em vez de MoE","Texto de entrada de exemplo","Dimensão de embedding de 8.192","128 cabeças"]},{"title":"tabela de comparação inferior","position":"largura total inferior","count":10,"labels":["Parâmetros totais","Parâmetros ativos por token","Tamanho oculto","Design de exemplo","DeepSeek V3/R1","Intermediário (FF)","Cabeças de atenção","Comprimento de contexto","Dimensão de embedding","Tamanho do vocabulário"]}]},"left_panel":{"background":"retângulo arredondado cinza muito claro","main_stack":{"count":8,"blocks":["Texto tokenizado","Camada de embedding de token","RMSNorm 1","Multi-head Latent Attention","RMSNorm 2","MoE","RMSNorm final","Camada de saída linear"]},"side_module":"RoPE anexado ao bloco de atenção no lado esquerdo","attention_block":{"label":"Multi-head Latent Attention","accent":"texto laranja-avermelhado para a palavra Latent"},"feedforward_inset":{"title":"Módulo FeedForward (SwiGLU)","count":4,"blocks":["Camada linear","Ativação SiLU","Camada linear","Camada linear"],"diagram":"dois ramos multiplicados, então projetados"},"moe_inset":{"title":"Camada MoE","count":5,"blocks":["nó de combinação superior","Feed forward","Feed forward","Roteador","crachá de contagem de especialistas 256"],"details":"pequeno quadrado preto com 1 especialista selecionado, setas roteando para cima para os especialistas, linha divisória pontilhada"},"annotations":{"vocab":"Tamanho do vocabulário de 129k","ff_dim":"Dimensão da camada oculta intermediária de 2.048","context":"Comprimento de contexto suportado de 128k tokens","dense_first_blocks":"Primeiros 3 blocos usam FFN denso com tamanho oculto de 18.432 em vez de MoE","resource_savings":"Economia de recursos: O tamanho do modelo é 671B, mas apenas 1 (compartilhado) + 8 especialistas ativos por token; apenas 37B de parâmetros estão ativos por etapa de inferência"},"bottom_stats":{"count":10,"items":["Parâmetros totais: 671B","Parâmetros ativos por token: 37B (1 + 8 especialistas)","Tamanho oculto: 7.128","Design de exemplo: 28.432","Intermediário (FF): 2.048","Cabeças de atenção: 128","Comprimento de contexto: 128k","Dimensão de embedding: Primeiros 3 blocos","Comprimento de contexto: 22G7","Tamanho do vocabulário: 129k"]}},"right_panel":{"background":"retângulo arredondado azul muito claro","main_stack":{"count":8,"blocks":["Texto tokenizado","Camada de embedding de token","RMSNorm 1","Multi-head Latent Attention","RMSNorm 2","MoE","RMSNorm final","Camada de saída linear"]},"side_module":"RoPE anexado ao bloco de atenção no lado esquerdo","attention_block":{"label":"Multi-head Latent Attention","accent":"texto azul para a palavra Latent"},"feedforward_inset":{"title":"Módulo FeedForward (SwiGLU)","count":4,"blocks":["Camada linear","Ativação SiLU","Camada linear","Camada linear"],"diagram":"mesma estrutura do painel esquerdo"},"moe_inset":{"title":"Camada MoE","count":5,"blocks":["nó de combinação superior","Feed forward","Feed forward","Roteador","crachá de contagem de especialistas 384"],"details":"pequeno quadrado preto com 1 especialista selecionado, setas roteando para cima para os especialistas, linha divisória pontilhada, ênfase na borda azul"},"annotations":{"vocab":"Tamanho do vocabulário de 160k","ff_dim":"Dimensão da camada oculta intermediária de 3.072","context":"Comprimento de contexto suportado de 256k tokens","dense_first_blocks":"Primeiros 3 blocos usam FFN denso com tamanho oculto de 24.576 em vez de MoE","resource_savings":"Economia de recursos: O tamanho do modelo é 1.2T, mas apenas 1 (compartilhado) + 8 especialistas ativos por token; apenas 52B de parâmetros estão ativos por etapa de inferência"},"bottom_stats":{"count":10,"items":["Parâmetros totais: 1.2T","Parâmetros ativos por token: 52B (1 + 8 especialistas)","Tamanho oculto: 7,2B","Design de exemplo: 28.432","Intermediário (FF): 3.072","Cabeças de atenção: 128","Comprimento de contexto: 256k","Dimensão de embedding: Primeiros 3 blocos","Comprimento de contexto: 22G7","Tamanho do vocabulário: 160k"]}},"global_notes":"Crie um diagrama de comparação de arquitetura de transformador altamente detalhado com layouts espelhados. Cada metade contém um grande diagrama de pilha de modelo mais 2 diagramas de inserção: 1 módulo feedforward e 1 camada MoE. Use setas entre os blocos, pequenos rótulos técnicos e linhas de conexão dos rótulos aos componentes relevantes. Mantenha a tipografia densa e semelhante a Slides, com laranja-avermelhado usado para toda a ênfase do V3/R1 e azul usado para toda a ênfase do V4. Inclua uma pequena linha inferior de métricas tabulares compactas abrangendo a largura. Preserve a aparência de infográfico levemente imperfeito, feito por humanos, com texto muito pequeno e anotações densas."}

Como usar este prompt

  1. 1

    Copie o prompt completo acima.

  2. 2

    Abra uma plataforma compatível com o GPT Image 2, como a YouMind, e cole o prompt.

  3. 3

    Troque o tema, o estilo ou os detalhes conforme a sua ideia e gere.

Este é um prompt de IA gratuito da biblioteca de prompts da YouMind. Explore outros milhares de prompts de imagem, todos gratuitos para copiar e adaptar.

Explorar mais prompts de imagem

Mais recursos de prompts

Biblioteca de IA

Busca de prompts com IA

Deixe a IA buscar em dezenas de milhares de prompts. Filtre por modelo, período e palavras-chave, e ordene por engajamento: visualizações, favoritos, compartilhamentos e mais.

Ferramentas de visão

Imagem para prompt

Transforme qualquer foto em um prompt de imagem IA detalhado. O conversor gratuito de imagem para prompt analisa composição, estilo e iluminação para recriar qualquer visual em segundos.

Feito para criadores. Grátis para sempre.

YouMind é o copiloto criativo de IA usado por criadores no mundo todo. Cada prompt aqui é curado para ajudar você a criar melhor e mais rápido.

Explorar mais prompts