DeepSeek V3/R1 ve DeepSeek V4 transformer mimarilerini karşılaştıran, sosyal medya paylaşımları, sunumlar veya model analizi görselleri için uygun, yoğun ve teknik bir karşılaştırmalı bilgi grafiği.
{"type":"yan yana AI mimari karşılaştırma bilgi grafiği","style":"temiz teknik diyagram, beyaz arka plan, ince siyah ana hatlar, yuvarlatılmış dikdörtgenler, kesikli açıklama kutuları, renk kodlu vurgular, sunum-Slides estetiği, vektörel bilgi grafiği","canvas":{"aspect_ratio":"2:1","resolution":"geniş yatay"},"title_row":{"left_title":"DeepSeek V3/R1 (671 milyar)","right_title":"DeepSeek V4 (1.2 trilyon)","left_title_color":"parlak turuncu-kırmızı","right_title_color":"parlak mavi"},"layout":{"columns":2,"sections":[{"title":"DeepSeek V3/R1 (671 milyar)","position":"sol yarım","count":9,"labels":["129k kelime dağarcığı boyutu","FeedForward (SwiGLU) modülü","2.048 ara gizli katman boyutu","MoE katmanı","128k token desteklenen bağlam uzunluğu","İlk 3 blok, MoE yerine 18.432 gizli boyuta sahip yoğun FFN kullanır","Örnek girdi metni","7.168 gömme boyutu","128 başlık"]},{"title":"DeepSeek V4 (1.2 trilyon)","position":"sağ yarım","count":9,"labels":["160k kelime dağarcığı boyutu","FeedForward (SwiGLU) modülü","3.072 ara gizli katman boyutu","MoE katmanı","256k token desteklenen bağlam uzunluğu","İlk 3 blok, MoE yerine 24.576 gizli boyuta sahip yoğun FFN kullanır","Örnek girdi metni","8.192 gömme boyutu","128 başlık"]},{"title":"alt karşılaştırma tablosu","position":"alt tam genişlik","count":10,"labels":["Toplam parametreler","Token başına aktif parametreler","Gizli boyut","Örnek tasarım","DeepSeek V3/R1","Ara (FF)","Dikkat başlıkları","Bağlam uzunluğu","Gömme boyutu","Kelime dağarcığı boyutu"]}]},"left_panel":{"background":"çok açık gri yuvarlatılmış dikdörtgen","main_stack":{"count":8,"blocks":["Tokenize edilmiş metin","Token gömme katmanı","RMSNorm 1","Çok başlıklı gizli dikkat (Multi-head Latent Attention)","RMSNorm 2","MoE","Final RMSNorm","Lineer çıktı katmanı"]},"side_module":"Sol taraftaki dikkat bloğuna bağlı RoPE","attention_block":{"label":"Çok başlıklı gizli dikkat","accent":"Latent kelimesi için turuncu-kırmızı metin"},"feedforward_inset":{"title":"FeedForward (SwiGLU) modülü","count":4,"blocks":["Lineer katman","SiLU aktivasyonu","Lineer katman","Lineer katman"],"diagram":"çarpılan ve ardından yansıtılan iki dal"},"moe_inset":{"title":"MoE katmanı","count":5,"blocks":["üst birleştirme düğümü","Feed forward","Feed forward","Yönlendirici","uzman sayısı rozeti 256"],"details":"1 seçili uzman içeren küçük siyah kare, uzmanlara doğru yönlenen oklar, kesikli ayırıcı çizgi"},"annotations":{"vocab":"129k kelime dağarcığı boyutu","ff_dim":"2.048 ara gizli katman boyutu","context":"128k token desteklenen bağlam uzunluğu","dense_first_blocks":"İlk 3 blok, MoE yerine 18.432 gizli boyuta sahip yoğun FFN kullanır","resource_savings":"Kaynak tasarrufu: Model boyutu 671B ancak token başına sadece 1 (paylaşımlı) + 8 uzman aktif; çıkarım adımı başına sadece 37B parametre aktif"},"bottom_stats":{"count":10,"items":["Toplam parametreler: 671B","Token başına aktif parametreler: 37B (1 + 8 uzman)","Gizli boyut: 7.128","Örnek tasarım: 28.432","Ara (FF): 2.048","Dikkat başlıkları: 128","Bağlam uzunluğu: 128k","Gömme boyutu: İlk 3 blok","Bağlam uzunluğu: 22G7","Kelime dağarcığı boyutu: 129k"]}},"right_panel":{"background":"çok açık mavi yuvarlatılmış dikdörtgen","main_stack":{"count":8,"blocks":["Tokenize edilmiş metin","Token gömme katmanı","RMSNorm 1","Çok başlıklı gizli dikkat (Multi-head Latent Attention)","RMSNorm 2","MoE","Final RMSNorm","Lineer çıktı katmanı"]},"side_module":"Sol taraftaki dikkat bloğuna bağlı RoPE","attention_block":{"label":"Çok başlıklı gizli dikkat","accent":"Latent kelimesi için mavi metin"},"feedforward_inset":{"title":"FeedForward (SwiGLU) modülü","count":4,"blocks":["Lineer katman","SiLU aktivasyonu","Lineer katman","Lineer katman"],"diagram":"sol panelle aynı yapı"},"moe_inset":{"title":"MoE katmanı","count":5,"blocks":["üst birleştirme düğümü","Feed forward","Feed forward","Yönlendirici","uzman sayısı rozeti 384"],"details":"1 seçili uzman içeren küçük siyah kare, uzmanlara doğru yönlenen oklar, kesikli ayırıcı çizgi, mavi kenarlık vurgusu"},"annotations":{"vocab":"160k kelime dağarcığı boyutu","ff_dim":"3.072 ara gizli katman boyutu","context":"256k token desteklenen bağlam uzunluğu","dense_first_blocks":"İlk 3 blok, MoE yerine 24.576 gizli boyuta sahip yoğun FFN kullanır","resource_savings":"Kaynak tasarrufu: Model boyutu 1.2T ancak token başına sadece 1 (paylaşımlı) + 8 uzman aktif; çıkarım adımı başına sadece 52B parametre aktif"},"bottom_stats":{"count":10,"items":["Toplam parametreler: 1.2T","Token başına aktif parametreler: 52B (1 + 8 uzman)","Gizli boyut: 7.2B","Örnek tasarım: 28.432","Ara (FF): 3.072","Dikkat başlıkları: 128","Bağlam uzunluğu: 256k","Gömme boyutu: İlk 3 blok","Bağlam uzunluğu: 22G7","Kelime dağarcığı boyutu: 160k"]}},"global_notes":"Yansıtılmış düzenlere sahip, oldukça detaylı bir transformer mimarisi karşılaştırma diyagramı oluşturun. Her yarı, bir büyük model yığını diyagramı ve 2 iç içe diyagram içerir: 1 feedforward modülü ve 1 MoE katmanı. Bloklar arasında oklar, küçük teknik etiketler ve etiketlerden ilgili bileşenlere giden bağlantı çizgileri kullanın. Tipografiyi yoğun ve Slides benzeri tutun; V3/R1 vurguları için turuncu-kırmızı, V4 vurguları için mavi kullanın. Genişliği kapsayan küçük bir alt kompakt metrik satırı ekleyin. Çok küçük metinler ve kalabalık açıklamalarla hafif kusurlu, insan yapımı bilgi grafiği görünümünü koruyun."}