Modern AI sistemlerini açıklayan, teknik sunumlar, eğitim materyalleri ve sosyal medya bilgilendirmeleri için kullanışlı, yoğun ve fütüristik bir eğitim posteri.
Hedef: AI ALTYAPISI başlıklı ve MODERN AI SİSTEMLERİ NASIL ÇALIŞIR alt başlıklı, veri hatlarından GPU eğitim kümelerine, çıkarım sunumundan (inference serving), toplu işlemeye (batching) ve KV önbelleğine kadar modern AI altyapısını açıklayan, oldukça profesyonel dikey bir eğitim infografiği oluşturun.
Tuval: Dikey poster, 4:5 en-boy oranı, koyu lacivert fütüristik veri merkezi estetiği. Dağlar, sunucu rafları, GPU çipi illüstrasyonu, neon devre izleri, ince yuvarlatılmış paneller, beyaz ve camgöbeği tipografi ve küçük turuncu numaralı rozetler içeren parlayan mavi/mor bir siber ızgara arka planı kullanın. Genel görünüm, yoğun ancak okunabilir, birinci sınıf bir teknik açıklayıcı posteri andırmalıdır.
Düzen: Sol üstte büyük başlık, altında küçük alt başlık ve slogan, sağ üstte dekoratif sunucu rafları ve GPU çipi. İçeriği tam olarak 8 numaralı ana bölüme, sağ tarafta bir “Temel Kavramlar” sütununa ve alt kısımda bir akış alt bilgisine yerleştirin. Hassas panel kenarlıkları, küçük simgeler, oklar, diyagramlar, tablolar ve mikro etiketler kullanın.
Bölümler ve gerekli içerik:
1. Veri Hattı: Oklarla birbirine bağlı tam olarak 5 hat aşaması gösterin: Ham Veri Kaynakları, Alım ve Temizleme, Etiketleme / Kürasyon, Tokenlaştırma / Parçalara Ayırma ve Sharding (Parçalama) & Depolama. Ham Veri Kaynakları tam olarak 5 madde içerir: Web sayfaları, Belgeler, Kod, Görseller, Günlükler. Alım ve Temizleme tam olarak 3 madde içerir: Filtreleme, Tekilleştirme, Normalleştirme. Etiketleme / Kürasyon tam olarak 3 madde içerir: Kalite kontrolleri, İnsan / sezgisel, Veri kümesi oluşturma. Tokenlaştırma / Parçalara Ayırma tam olarak 3 madde içerir: Metni tokenlara dönüştürme, Belgelere ayırma, Özel tokenlar ekleme. Sharding & Depolama tam olarak 3 madde içerir: Parçalara ayırma, Dengeli bölümler, Paralel okumalar için optimize etme. Verilerin temizlendiğini, tekilleştirildiğini, küratörlüğünün yapıldığını, tokenlaştırıldığını ve birçok işçinin verimli bir şekilde okuyabilmesi için parçalar halinde depolandığını belirten bir açıklama ekleyin.
2. Depolama + Orkestrasyon Katmanı: Tam olarak 3 dikey kart ekleyin: Bulut-veritabanı simgeli ve “S3 / GCS / Azure Blob veya şirket içi nesne depolama” notlu Nesne Depolama; pano simgeli ve “Çalıştırmalar & metrikler,” “Hiperparametreler,” “Soy ağacı & yapıtlar” maddeli Meta Veri / Deney Takibi; grafik/büyüteç simgeli ve “Metrikler & uyarılar,” “Günlük birleştirme,” “İzleme & hata ayıklama” maddeli İzleme & Günlükleme. Kontrol katmanının bilgi işlem işlerini koordine ettiğini, deneyleri takip ettiğini, kontrol noktalarını depoladığını ve kullanımı, hataları ve maliyetleri izlediğini belirten bir alt bilgi notu ekleyin.
3. Eğitim Kümesi Mimarisi: Eğitim Kümesi Mimarisi başlıklı büyük merkezi mimari diyagramı. 2x2 ızgara düzeninde, “Yüksek Hızlı Ağ InfiniBand / RoCE” etiketli parlayan yüksek hızlı ağ bağlantılarıyla birbirine bağlı tam olarak 4 GPU / Hızlandırıcı Düğüm kutusu gösterin. Her düğüm CPU Ana Bilgisayarı (Çok çekirdekli), RAM, 8x H100 gibi GPU'lar ve NVMe yerel SSD içerir. Düğümler arasına noktalı bağlantılar ekleyin. Alt kısma tam olarak 3 mini panel ekleyin: Bir Düğümün İçi, Veri Paralelliği ve Dağıtık Eğitim Paralelliği (Gösterge). Bir Düğümün İçi, PCIe/NVLink/NVSwitch hatlarıyla birden fazla GPU'ya bağlı CPU'yu göstermelidir. Dağıtık Eğitim Paralelliği göstergesi, Aşama 1, Aşama 2, Aşama 3, Aşama 4 olarak etiketlenmiş tam olarak 4 aşamayı göstermelidir.
4. Eğitim Adımı: Tam olarak 6 aşamalı soldan sağa bir eğitim akışı oluşturun: Giriş Tokenları, İleri Geçiş (Forward Pass), Kayıp Hesaplama, Geri Geçiş (Backward Pass), Gradyanlar, Optimize Edici Güncellemesi. Bir kontrol noktası simge yığını, FP32, FP16/BF16, FP8'den bahseden bir “Model Hassasiyeti” kutusu ve bir “Optimize Edici Durumu” kutusu ekleyin. Gradyan birikim oklarını ve eğitim sırasında modelin çıktıları tahmin ettiğini, kaybı hesapladığını, gradyanları geriye doğru yaydığını ve ağırlıkları güncellediğini, bunun milyarlarca kez tekrarlandığını açıklayan bir başlık ekleyin.
5. Çıkarım Sunum Hattı: Üst kısımda tam olarak 6 aşamalı kompakt bir sunum diyagramı oluşturun: Kullanıcı İsteği, API Ağ Geçidi, Tokenlaştırıcı, Zamanlayıcı / Yönlendirici, Model Sunucusu (GPU), Akış Çıktısı. Panel içine tam olarak 3 istek satırı içeren Dinamik Toplu İşleme, Prefill ve Decode Döngüsünü gösteren bir Model Sunucusu kutusu, GPU Belleğinde KV Önbelleği, isteğe bağlı adaptörler ve Model Kopyası 1, Model Kopyası 2, Model Kopyası N olarak etiketlenmiş tam olarak 3 model kopyasını birbirine bağlayan bir yük dengeleyici ekleyin.
6. Operasyonlar, Güvenilirlik ve Güvenlik: Simgelerle tam olarak 6 operasyonel kart ekleyin: Otomatik Ölçeklendirme, Telemetri / Gözlemlenebilirlik, Hız Sınırlama & Kotalar, Güvenlik Filtreleri / Korumalar, Sürüm Oluşturma / Geri Alma, Maliyet İzleme. Üretim AI sistemlerinin güvenilir, güvenli ve maliyet açısından verimli kalması için güçlü operasyonel araçlara ihtiyaç duyduğunu belirten bir not ekleyin.
7. Eğitim ve Çıkarım Karşılaştırması: Tam olarak 6 satırlı bir karşılaştırma tablosu ekleyin: Hedef, Ana Darboğaz, Bellek Odağı, Tipik Metrik, Ölçek Modeli, Dayanıklılık İhtiyaçları. Eğitim ve Çıkarım (Sunum) etiketli iki sütun kullanın. Eğitim; veriden model ağırlıklarını öğrenmeyi, dağıtık hesaplama ve veri taşıma bant genişliğini, aktivasyonları/gradyanları/optimize edici durumlarını, saniyedeki token sayısını veya yakınsamayı, büyük toplu uzun işleri ve kontrol noktası/hata toleransını tanımlamalıdır. Çıkarım; kullanıcılar için yararlı yanıtlar üretmeyi, gecikme ve verimi, model ağırlıkları artı KV önbelleğini, gecikme ve saniyedeki token sayısını, birçok kısa isteği ve yüksek kullanılabilirliği/kademeli bozulmayı tanımlamalıdır.
8. Sağ sütun Temel Kavramlar: Tam olarak 5 harfli kart içeren Temel Kavramlar başlıklı uzun bir sağ kenar çubuğu oluşturun: A. Toplu İş Boyutu, B. Dizi Uzunluğu / Bağlam Penceresi, C. KV Önbelleği, D. Verim ve Gecikme, E. Parametreler / Ağırlıklar / Aktivasyonlar. Kart A, toplu iş boyutunu tanımlamalı ve token/kişi simgeleriyle küçük toplu iş ile büyük toplu işi göstermelidir. Kart B, istem tokenlarını ve T1, T2, T3, T4, …, Tn olarak etiketlenmiş token blokları olarak uzun bağlamı göstermelidir. Kart C, mor silindirik bir KV Önbelleğini besleyen istem tokenlarını, ardından önbellekten okuyan yeni bir tokenı göstermelidir. Kart D, tam olarak 2 gösterge göstermelidir: Verim ve Gecikme. Kart E, çarpma ile birbirine bağlı mavi ve mor ızgaralar olarak ağırlıkları ve aktivasyonları göstermelidir. Kenar çubuğunun altına, prefill'in tüm istemi işlediğini ve decode'un KV önbelleğini kullanarak her seferinde bir token ürettiğini açıklayan küçük bir “Prefill vs Decode” notu ekleyin.
Alt Bilgi: “VERİ → EĞİTİM → ÇIKARIM → DEĞER” dizisi, solda küçük dairesel bir roket/pusula tarzı simge ve şu kapanış alıntısı ile bir alt gezinme şeridi ekleyin: Veri, hesaplama ve mühendislik mükemmelliği ile akıllı sistemlere güç veriyoruz.
Görsel stil: Yoğun kurumsal teknik infografik, net vektör ve yarı 3D simgeler, parlayan camgöbeği ana hatlar, ince gradyanlar, hacimsel ışık, küçük şemalar, minyatür grafikler ve modern sans-serif etiketlerle temiz serif başlık tipografisi. Renk paleti koyu lacivert, elektrik mavisi, camgöbeği, menekşe, beyaz ve küçük kehribar vurgular olmalıdır.
Kısıtlamalar: Tam olarak 8 numaralı ana bölüm, tam olarak 5 temel kavram kartı, tam olarak 4 GPU düğümü, tam olarak 6 eğitim adımı aşaması, tam olarak 6 çıkarım aşaması, tam olarak 6 operasyon kartı ve tam olarak 6 eğitim-çıkarım karşılaştırma tablosu satırı kullanın. Tüm görünür metinleri İngilizce tutun, filigranlardan kaçının, marka logolarından kaçının ve yoğun düzene rağmen yüksek okunabilirliği koruyun.