Infografía comparativa de la arquitectura DeepSeek V3 vs V4

Una infografía técnica detallada que compara lado a lado las arquitecturas transformer de DeepSeek V3/R1 y DeepSeek V4, ideal para publicaciones en redes sociales, presentaciones o visualizaciones de análisis de modelos.

Instrucción
{"type":"infografía comparativa de arquitectura de IA lado a lado","style":"diagrama técnico limpio, fondo blanco, contornos negros finos, rectángulos redondeados, cuadros de texto discontinuos, resaltados codificados por colores, estética de Slides de presentación, infografía vectorial","canvas":{"aspect_ratio":"2:1","resolution":"horizontal ancho"},"title_row":{"left_title":"DeepSeek V3/R1 (671 mil millones)","right_title":"DeepSeek V4 (1.2 billones)","left_title_color":"naranja-rojo brillante","right_title_color":"azul brillante"},"layout":{"columns":2,"sections":[{"title":"DeepSeek V3/R1 (671 mil millones)","position":"mitad izquierda","count":9,"labels":["Tamaño del vocabulario de 129k","Módulo FeedForward (SwiGLU)","Dimensión de la capa oculta intermedia de 2,048","Capa MoE","Longitud de contexto admitida de 128k tokens","Los primeros 3 bloques usan FFN denso con tamaño oculto de 18,432 en lugar de MoE","Texto de entrada de muestra","Dimensión de embedding de 7,168","128 cabezales"]},{"title":"DeepSeek V4 (1.2 billones)","position":"mitad derecha","count":9,"labels":["Tamaño del vocabulario de 160k","Módulo FeedForward (SwiGLU)","Dimensión de la capa oculta intermedia de 3,072","Capa MoE","Longitud de contexto admitida de 256k tokens","Los primeros 3 bloques usan FFN denso con tamaño oculto de 24,576 en lugar de MoE","Texto de entrada de muestra","Dimensión de embedding de 8,192","128 cabezales"]},{"title":"tabla comparativa inferior","position":"inferior ancho completo","count":10,"labels":["Parámetros totales","Parámetros activos por token","Tamaño oculto","Diseño de muestra","DeepSeek V3/R1","Intermedio (FF)","Cabezales de atención","Longitud de contexto","Dimensión de embedding","Tamaño del vocabulario"]}]},"left_panel":{"background":"rectángulo redondeado gris muy claro","main_stack":{"count":8,"blocks":["Texto tokenizado","Capa de embedding de tokens","RMSNorm 1","Atención latente de múltiples cabezales","RMSNorm 2","MoE","RMSNorm final","Capa de salida lineal"]},"side_module":"RoPE adjunto al bloque de atención en el lado izquierdo","attention_block":{"label":"Atención latente de múltiples cabezales","accent":"texto naranja-rojo para la palabra Latente"},"feedforward_inset":{"title":"Módulo FeedForward (SwiGLU)","count":4,"blocks":["Capa lineal","Activación SiLU","Capa lineal","Capa lineal"],"diagram":"dos ramas multiplicadas, luego proyectadas"},"moe_inset":{"title":"Capa MoE","count":5,"blocks":["nodo de combinación superior","Feed forward","Feed forward","Router","insignia de conteo de expertos 256"],"details":"pequeño cuadrado negro con 1 experto seleccionado, flechas dirigidas hacia los expertos, línea divisoria punteada"},"annotations":{"vocab":"Tamaño del vocabulario de 129k","ff_dim":"Dimensión de la capa oculta intermedia de 2,048","context":"Longitud de contexto admitida de 128k tokens","dense_first_blocks":"Los primeros 3 bloques usan FFN denso con tamaño oculto de 18,432 en lugar de MoE","resource_savings":"Ahorro de recursos: El tamaño del modelo es 671B pero solo 1 (compartido) + 8 expertos activos por token; solo 37B de parámetros están activos por paso de inferencia"},"bottom_stats":{"count":10,"items":["Parámetros totales: 671B","Parámetros activos por token: 37B (1 + 8 expertos)","Tamaño oculto: 7,128","Diseño de muestra: 28,432","Intermedio (FF): 2,048","Cabezales de atención: 128","Longitud de contexto: 128k","Dimensión de embedding: Primeros 3 bloques","Longitud de contexto ler: 22G7","Tamaño del vocabulario: 129k"]}},"right_panel":{"background":"rectángulo redondeado azul muy claro","main_stack":{"count":8,"blocks":["Texto tokenizado","Capa de embedding de tokens","RMSNorm 1","Atención latente de múltiples cabezales","RMSNorm 2","MoE","RMSNorm final","Capa de salida lineal"]},"side_module":"RoPE adjunto al bloque de atención en el lado izquierdo","attention_block":{"label":"Atención latente de múltiples cabezales","accent":"texto azul para la palabra Latente"},"feedforward_inset":{"title":"Módulo FeedForward (SwiGLU)","count":4,"blocks":["Capa lineal","Activación SiLU","Capa lineal","Capa lineal"],"diagram":"misma estructura que el panel izquierdo"},"moe_inset":{"title":"Capa MoE","count":5,"blocks":["nodo de combinación superior","Feed forward","Feed forward","Router","insignia de conteo de expertos 384"],"details":"pequeño cuadrado negro con 1 experto seleccionado, flechas dirigidas hacia los expertos, línea divisoria punteada, énfasis de borde azul"},"annotations":{"vocab":"Tamaño del vocabulario de 160k","ff_dim":"Dimensión de la capa oculta intermedia de 3,072","context":"Longitud de contexto admitida de 256k tokens","dense_first_blocks":"Los primeros 3 bloques usan FFN denso con tamaño oculto de 24,576 en lugar de MoE","resource_savings":"Ahorro de recursos: El tamaño del modelo es 1.2T pero solo 1 (compartido) + 8 expertos activos por token; solo 52B de parámetros están activos por paso de inferencia"},"bottom_stats":{"count":10,"items":["Parámetros totales: 1.2T","Parámetros activos por token: 52B (1 + 8 expertos)","Tamaño oculto: 7,2B","Diseño de muestra: 28,432","Intermedio (FF): 3,072","Cabezales de atención: 128","Longitud de contexto: 256k","Dimensión de embedding: Primeros 3 bloques","Longitud de contexto ler: 22G7","Tamaño del vocabulario: 160k"]}},"global_notes":"Cree un diagrama de comparación de arquitectura transformer altamente detallado con diseños reflejados. Cada mitad contiene un diagrama de pila de modelo grande más 2 diagramas insertados: 1 módulo feedforward y 1 capa MoE. Use flechas entre bloques, etiquetas técnicas pequeñas y líneas conectoras desde las etiquetas hasta los componentes relevantes. Mantenga la tipografía densa y similar a una diapositiva, con naranja-rojo usado para todo el énfasis de V3/R1 y azul usado para todo el énfasis de V4. Incluya una pequeña fila inferior de métricas tabulares compactas que abarquen todo el ancho. Preserve el aspecto de infografía ligeramente imperfecta y hecha por humanos con texto muy pequeño y anotaciones abarrotadas."}

Cómo usar este prompt

  1. 1

    Copia el prompt completo de arriba.

  2. 2

    Abre una plataforma compatible con GPT Image 2, como YouMind, y pega el prompt.

  3. 3

    Cambia el tema, el estilo o los detalles según tu idea y luego genera.

Este es un prompt de IA gratuito de la biblioteca de prompts de YouMind. Explora miles de prompts de imagen más, todos gratis para copiar y adaptar.

Explorar más prompts de imagen

Más funciones de prompts

Biblioteca de IA

Búsqueda de prompts con IA

Que la IA busque entre decenas de miles de prompts. Filtrá por modelo, rango de fechas y palabras clave, y ordená por interacción: vistas, guardados, reposts y más.

Herramientas de visión

Imagen a prompt

Convierte cualquier foto en un prompt de imagen IA detallado. El conversor gratuito de imagen a prompt analiza composición, estilo e iluminación para recrear cualquier estética en segundos.

Creado para creadores. Gratis para siempre.

YouMind es el copiloto creativo con IA en el que confían creadores de todo el mundo. Cada prompt está curado para ayudarte a crear mejor y más rápido.

Explorar más prompts