RTX PRO 6000 ve DGX Spark için vLLM'de NVFP4 KV önbelleği (ve gelecekte RTX Spark mı...?)

RTX PRO 6000 ve DGX Spark için vLLM'de NVFP4 KV önbelleği (ve gelecekte RTX Spark mı...?)

@jetha
İNGILIZCE2 gün önce · 23 Haz 2026

Yapay zekâ özellikleri

428K
115
7
3
71

TL;DR

Gemma 4'ün 512 genişliğindeki başlıklarını etkinleştirmek için VO-split hilesini içeren, tüketici ve SoC Blackwell donanımlarında vLLM için yerel NVFP4 KV önbellek desteğinin uygulanmasına yönelik teknik bir derinlemesine inceleme.

YouMind’da yeniden üret
Üreticiler için

Markdown'ınızı temiz bir 𝕏 makalesine dönüştürün

Kendi uzun yazılarınızı yayımlarken görselleri, tabloları ve kod bloklarını 𝕏 için biçimlendirmek zahmetlidir. YouMind, eksiksiz bir Markdown taslağını temiz ve hemen paylaşılabilir bir 𝕏 makalesine dönüştürür.

Markdown'dan 𝕏'e deneyin

Çözülecek daha fazla kalıp

Son viral makaleler

Daha fazla viral makale keşfet

İçerik üreticileri için tasarlandı.

𝕏 üzerindeki viral makalelerden içerik fikirleri bulun, neden işe yaradıklarını çözün ve kanıtlanmış kalıpları bir sonraki içerik açınıza dönüştürün.