Infographie comparative des architectures DeepSeek V3 et V4

Une infographie technique dense comparant côte à côte les architectures de transformeurs DeepSeek V3/R1 et DeepSeek V4, idéale pour les réseaux sociaux, les présentations ou les visuels d'analyse de modèles.

Consigne
{"type":"infographie comparative côte à côte d'architecture IA","style":"diagramme technique épuré, fond blanc, contours noirs fins, rectangles arrondis, boîtes de légende en pointillés, surlignages par code couleur, esthétique de présentation Slides, infographie vectorielle","canvas":{"aspect_ratio":"2:1","resolution":"horizontal large"},"title_row":{"left_title":"DeepSeek V3/R1 (671 milliards)","right_title":"DeepSeek V4 (1,2 billion)","left_title_color":"orange-rouge vif","right_title_color":"bleu vif"},"layout":{"columns":2,"sections":[{"title":"DeepSeek V3/R1 (671 milliards)","position":"moitié gauche","count":9,"labels":["Taille du vocabulaire de 129k","Module FeedForward (SwiGLU)","Dimension de la couche cachée intermédiaire de 2 048","Couche MoE","Longueur de contexte supportée de 128k jetons","Les 3 premiers blocs utilisent un FFN dense avec une taille cachée de 18 432 au lieu de MoE","Exemple de texte d'entrée","Dimension d'embedding de 7 168","128 têtes"]},{"title":"DeepSeek V4 (1,2 billion)","position":"moitié droite","count":9,"labels":["Taille du vocabulaire de 160k","Module FeedForward (SwiGLU)","Dimension de la couche cachée intermédiaire de 3 072","Couche MoE","Longueur de contexte supportée de 256k jetons","Les 3 premiers blocs utilisent un FFN dense avec une taille cachée de 24 576 au lieu de MoE","Exemple de texte d'entrée","Dimension d'embedding de 8 192","128 têtes"]},{"title":"tableau comparatif inférieur","position":"bas pleine largeur","count":10,"labels":["Paramètres totaux","Paramètres actifs par jeton","Taille cachée","Dimension d'exemple","DeepSeek V3/R1","Intermédiaire (FF)","Têtes d'attention","Longueur de contexte","Dimension d'embedding","Taille du vocabulaire"]}]},"left_panel":{"background":"rectangle arrondi gris très clair","main_stack":{"count":8,"blocks":["Texte tokenisé","Couche d'embedding de jetons","RMSNorm 1","Multi-head Latent Attention","RMSNorm 2","MoE","RMSNorm final","Couche de sortie linéaire"]},"side_module":"RoPE attaché au bloc d'attention sur le côté gauche","attention_block":{"label":"Multi-head Latent Attention","accent":"texte orange-rouge pour le mot Latent"},"feedforward_inset":{"title":"Module FeedForward (SwiGLU)","count":4,"blocks":["Couche linéaire","Activation SiLU","Couche linéaire","Couche linéaire"],"diagram":"deux branches multipliées, puis projetées"},"moe_inset":{"title":"Couche MoE","count":5,"blocks":["nœud de combinaison supérieur","Feed forward","Feed forward","Routeur","badge de nombre d'experts 256"],"details":"petit carré noir avec 1 expert sélectionné, flèches routant vers le haut vers les experts, ligne de séparation en pointillés"},"annotations":{"vocab":"Taille du vocabulaire de 129k","ff_dim":"Dimension de la couche cachée intermédiaire de 2 048","context":"Longueur de contexte supportée de 128k jetons","dense_first_blocks":"Les 3 premiers blocs utilisent un FFN dense avec une taille cachée de 18 432 au lieu de MoE","resource_savings":"Économies de ressources : la taille du modèle est de 671B mais seuls 1 (partagé) + 8 experts sont actifs par jeton ; seuls 37B de paramètres sont actifs par étape d'inférence"},"bottom_stats":{"count":10,"items":["Paramètres totaux : 671B","Paramètres actifs par jeton : 37B (1 + 8 experts)","Taille cachée : 7 128","Dimension d'exemple : 28 432","Intermédiaire (FF) : 2 048","Têtes d'attention : 128","Longueur de contexte : 128k","Dimension d'embedding : 3 premiers blocs","Longueur de contexte : 22G7","Taille du vocabulaire : 129k"]}},"right_panel":{"background":"rectangle arrondi bleu très clair","main_stack":{"count":8,"blocks":["Texte tokenisé","Couche d'embedding de jetons","RMSNorm 1","Multi-head Latent Attention","RMSNorm 2","MoE","RMSNorm final","Couche de sortie linéaire"]},"side_module":"RoPE attaché au bloc d'attention sur le côté gauche","attention_block":{"label":"Multi-head Latent Attention","accent":"texte bleu pour le mot Latent"},"feedforward_inset":{"title":"Module FeedForward (SwiGLU)","count":4,"blocks":["Couche linéaire","Activation SiLU","Couche linéaire","Couche linéaire"],"diagram":"même structure que le panneau gauche"},"moe_inset":{"title":"Couche MoE","count":5,"blocks":["nœud de combinaison supérieur","Feed forward","Feed forward","Routeur","badge de nombre d'experts 384"],"details":"petit carré noir avec 1 expert sélectionné, flèches routant vers le haut vers les experts, ligne de séparation en pointillés, bordure bleue pour l'accent"},"annotations":{"vocab":"Taille du vocabulaire de 160k","ff_dim":"Dimension de la couche cachée intermédiaire de 3 072","context":"Longueur de contexte supportée de 256k jetons","dense_first_blocks":"Les 3 premiers blocs utilisent un FFN dense avec une taille cachée de 24 576 au lieu de MoE","resource_savings":"Économies de ressources : la taille du modèle est de 1,2T mais seuls 1 (partagé) + 8 experts sont actifs par jeton ; seuls 52B de paramètres sont actifs par étape d'inférence"},"bottom_stats":{"count":10,"items":["Paramètres totaux : 1,2T","Paramètres actifs par jeton : 52B (1 + 8 experts)","Taille cachée : 7,2B","Dimension d'exemple : 28 432","Intermédiaire (FF) : 3 072","Têtes d'attention : 128","Longueur de contexte : 256k","Dimension d'embedding : 3 premiers blocs","Longueur de contexte : 22G7","Taille du vocabulaire : 160k"]}},"global_notes":"Créez un diagramme de comparaison d'architecture de transformeur très détaillé avec des mises en page en miroir. Chaque moitié contient un grand diagramme de pile de modèle plus 2 diagrammes encartés : 1 module feedforward et 1 couche MoE. Utilisez des flèches entre les blocs, de minuscules étiquettes techniques et des lignes de connexion reliant les étiquettes aux composants pertinents. Gardez la typographie dense et semblable à des Slides, avec de l'orange-rouge utilisé pour toute l'emphase V3/R1 et du bleu utilisé pour toute l'emphase V4. Incluez une petite rangée inférieure de métriques tabulaires compactes couvrant toute la largeur. Préservez l'aspect infographique légèrement imparfait et humain avec un texte très petit et des annotations denses."}

Comment utiliser ce prompt

  1. 1

    Copiez le prompt complet ci-dessus.

  2. 2

    Ouvrez une plateforme compatible avec GPT Image 2, comme YouMind, et collez le prompt.

  3. 3

    Modifiez le sujet, le style ou les détails selon votre idée, puis générez.

Voici un prompt IA gratuit de la bibliothèque de prompts de YouMind. Découvrez des milliers d'autres prompts images, tous libres de copie et d'adaptation.

Découvrir plus de prompts images

Plus de fonctions de prompts

Bibliothèque IA

Recherche de prompts par IA

Laissez l'IA chercher parmi des dizaines de milliers de prompts. Filtrez par modèle, plage de dates et mots-clés, puis triez par engagement : vues, favoris, partages et plus.

Outils visuels

Image vers prompt

Transformez toute photo en prompt d'image IA détaillé. Le convertisseur image vers prompt gratuit analyse la composition, le style et la lumière pour recréer n'importe quel rendu en quelques secondes.

Conçu pour les créateurs. Gratuit pour toujours.

YouMind est le copilote créatif IA adopté par des créateurs du monde entier. Chaque prompt est sélectionné pour vous aider à créer mieux, plus vite.

Explorer plus de prompts