X'in Açık Kaynak Algoritmasını Çalıştırdım ve İçerik Üreticilerinin Kontrol Edebileceği 7 Değişken Buldum

@GoSailGlobal
ÇINCE2 ay önce · 16 May 2026
542K
18
0
6
17

TL;DR

X'in Mayıs ayı algoritma güncellemesine dair yapılan bir analiz; kalite puanlarının, görüntüleme süresinin ve topluluk çevrelerinin dağıtımı nasıl etkilediğini ortaya koyarak içerik üreticileri için bir yol haritası sunuyor.

X'in Mayıs ayında açık kaynak yayınlanan öneri algoritmasını çalıştırdım ve açık kaynak kısmının gerçek Feed sıralamasının yalnızca %30'unu açıkladığını buldum. Kalan %70 ise sunucu taraflı konfigürasyonlarda, VM Ranker'da ve operasyon kurallarında gizli.

Ancak bu %30'luk herkese açık kod, tek bir soruyu yanıtlamak için yeterli: Yaratıcılar aslında neyi kontrol edebilir?

Orijinal Depo: xai-org/x-algorithm (15 Mayıs'ta güncellendi, 187 dosya ve 18.263 satır kod eklendi)

Bu yazı algoritma genelini tekrarlamayacak (Punk2898'in iki gönderisi zaten çok detaylı) ama üç şeye odaklanacak:

1️⃣ Pipeline'ı çalıştırırken gözlemlediğim mantığa aykırı olgular

2️⃣ Mayıs kod güncellemesinde yaratıcıları en çok etkileyen mekanizmalar

3️⃣ Bu gözlemlere dayanan spesifik operasyonel öneriler

Gözlem 1: Açık kaynak sıralama ile gerçek Feed neredeyse sıfır korelasyona sahip

Jason Zhu - inline image

Phoenix modelini kullanarak 537.000 spor gönderisinden oluşan bir külliyat çalıştırdım. Modelin verdiği nihai puan aralığı 0,0000 ile 0,0015 arasındaydı, son derece düzdü. Fav, Reply ve RT için tahmin edilen olasılıkların tümü sıfıra yakındı; sıralama, bir boşluk yaratmak için esas olarak Dwell (kalma süresi) sinyaline dayanıyordu.

Ardından karşılaştırma yapmak için gerçek Sana Özel feed'ini kazıdım. Kendall'ın tau'sunu kullanarak sıra korelasyonunu hesapladığımda sonuç -0,10 oldu.

Bu sayı şu anlama geliyor: Açık kaynak kodundaki demo ağırlıklarını (fav1,0 + reply0,5 + RT0,3 + dwell0,2) kullanarak gördüğünüz gerçek Feed sıralamasını tahmin etmek, rastgele tahmin etmek kadar doğru.

Gerçek Feed'de, sıfır etkileşimli gönderiler ilk 7'de görünürken, yüksek etkileşimli gönderiler 9. veya 10. sıraya itiliyor. 3 dakika içinde yayınlanmış, sıfır etkileşimli yepyeni gönderiler de Feed'e girebiliyor.

Bu ne anlama geliyor?

Bu, açık kaynak Phoenix modelinin yalnızca "ön aday elemesinden" sorumlu olduğu anlamına geliyor. Başka birinin Feed'inde sizin sıranızı asıl belirleyen şey, sonraki yeniden sıralama katmanlarıdır. Mayıs ayında açık kaynak yayınlanan kod, işte bu yeniden sıralama katmanlarının mantığını tamamlıyor.

Gözlem 2: 0,4 kalite puanı, görünmez bir yaşam-ölüm çizgisidir

Jason Zhu - inline image

Mayıs ayında eklenen yeni Grox modülü, bu güncellemenin en kritik parçasıdır. Phoenix'in yerini almaz; Phoenix'in yukarı akış tedarikçisidir. Her yeni gönderi gönderildikten sonra Grox, bir VLM büyük modeli kullanarak 5 şey yapar:

  • Bir kalite puanı atar (quality_score, 0 ila 1)
  • 7 boolean etiket oluşturur (yetişkin içeriği, şiddet, nefret söylemi vb.)
  • Bir slop puanı atar (slop_score, seviye 1-3)
  • Çok modlu gömme vektörleri oluşturur
  • PTOS güvenlik incelemesi gerçekleştirir

irir

Kod açıkça belirtiyor: İlk elemeden geçmek için quality_score >= 0,4 gereklidir. 0,4'ün altındaki her şey "düşük kaliteli" olarak etiketlenir ve sonraki dağıtım her yerde engellenir.

Bu 0,4 eşiği, anahtar kelime eşlemesiyle değil, VLM modeli tarafından değerlendirilir. Metninizin anlamını, görsellerinizin içeriğini ve video karelerini anlayabilir. Önceden "görsel ve anahtar kelime yığarak" kandırılabilen kural sistemleri artık çalışmıyor.

slop_score başka bir yeni silahtır: Şablon içerik, düşük bilgi yoğunluğu ve bariz yapay zeka üretimi izleri barındıran gönderiler yüksek puan alır. Seviye 1 normaldir; seviye 2-3, algoritmanın içeriği "sulandırdığınızı" düşündüğü anlamına gelir.

Gözlem 3: Kaydırarak geçmek, sadece "görmemek" değil, aktif bir cezadır

Jason Zhu - inline image

Mayıs sürümü, davranışsal sinyalleri 18 ayrı kafadan 19 ayrı kafa + 8 sürekli yardımcı kafaya yükseltti. Yeni sürekli kafalar, "ne kadar kalındığındı" ve "okuma tamamlanma oranı" gibi ince taneli metrikleri tahmin ediyor.

Ancak yaratıcılar üzerinde en büyük etkiye sahip sinyal şudur: not_dwelled.

Daha önce "kullanıcı etkileşimi yok"un tarafsız olduğunu, görülmemekle eşdeğer olduğunu düşünüyorduk. Yanlış. Bir kullanıcının gönderinizi hızla kaydırarak geçmesi, aktif bir olumsuz sinyaldir ve algoritma sizi bunun için cezalandıracaktır.

Bu şu anlama gelir:

  • Bir videonun ilk 1 saniyesinde dikkati çekememek = aktif ceza
  • Uzun bir gönderide ilgi çekici olmayan ilk cümle = aktif ceza
  • Görsel etkisi olmayan resimler = aktif ceza

Gerçek Feed'i gözlemlerken bir olgu fark ettim: Bazı sıfır etkileşimli gönderiler İlk 7'ye girebiliyordu, bazı yüksek etkileşimli gönderiler ise geriye itiliyordu. Makul bir açıklama: Bu sıfır etkileşimli gönderiler beğenilmemiş olsa da, kullanıcılar üzerlerinde kaldı (bir dwell sinyali üretti), oysa iyi verilere sahip görünen bazı gönderiler aslında çok sayıda hızlı kaydırmaya maruz kalmıştı.

Gözlem 4: Kimi takip ettiğiniz, algoritmanın sizi hangi çevreye koyacağını belirler

Jason Zhu - inline image

Mayıs kodu, mutual_follow_jaccard_hydrator'ı ekledi; bu, "sizinle belirli bir yazar arasındaki karşılıklı takip çevresinin benzerliğini" hesaplar.

Siz ve bir yazar aynı kişilerin çoğunu takip ediyorsanız (yüksek Jaccard katsayısı), algoritma sizi aynı "bilgi çevresinde" olarak kabul eder ve içeriklerini size itme eğilimi gösterir.

Bu mekanizma temel bir varsayımı değiştiriyor: Eskiden "içerik kalitesi dağıtımı belirler"di; şimdi "içerik kalitesi + çevre aidiyeti dağıtımı birlikte belirliyor."

Spesifik olarak:

  • Takip ettiğiniz her hesap, çevre kimliğinizi hesaplıyor
  • Rastgele takip etmek, çevre etiketlerinizi sulandırmak anlamına geliyor
  • Aynı alandaki KOL'larla karşılıklı takipleşmek, 100 rastgele hesabı tek yönlü takip etmekten çok daha etkili
  • Büyük V'lerin gönderileri altındaki kaliteli yorumlar, following_replied_users sinyal zincirine girecek ve avatarınız "takip ettiğiniz kişiler de buraya yorum yapmış" bildiriminde görünebilir

Kendi Sana Özel feed'im bunu doğruluyor: Önerilen içeriğin %60'ından fazlası, Çin yapay zeka çevresindeki yaratıcılardan geliyor çünkü takip listem bu çevrede yoğunlaşmış.

Gözlem 5: Yorum bölümü artık bağımsız bir parkur

Jason Zhu - inline image

Mayıs kodu, yorum bölümü için bağımsız bir puanlama sistemi ortaya çıkardı. Her yorum Grok tarafından 0-3 arası puanlanır:

  • 3 puan: Tartışma başlatabilecek bilgi artışı olan yorumlar
  • 2 puan: Normal etkileşim
  • 1 puan: Kısa ama spam değil
  • 0 puan: Spam etiketini tetikler, hesap itibarını etkiler

0 puanlı bir yorum sadece gizlenmekle kalmaz; hesabınızda "bir kere spam yorum yayınladığınıza" dair bir kayıt bırakır. Uzun vadeli birikim, genel hesap ağırlığınızı etkileyebilir.

Aynı zamanda, gönderinizin altındaki spam yorumlar da ana gönderinin ağırlığını etkiler. "Takipçi kas", "ilk" veya "+1" gibi yorumlar - algoritma onları sadece sevmez; onlar yüzünden ana gönderinizin dağıtımını düşürür.

Tersine, kaliteli bir yorumun maruz kalma değeri, 10 sıradan gönderi yayınlamaktan daha büyük olabilir. Büyük bir V'nin gönderisi altına, veriye dayalı ve tartışma başlatan bir yorum bırakmak, büyük V'nin trafik girişini ödünç almak gibidir.

Gözlem 6: Önbelleğe alma stratejileri "ne zaman yayın"ı, "neyin"den daha incelikli hale getiriyor

Jason Zhu - inline image

Kodda bir detay var: Önbellek havuzundaki gönderi sayısı >= 500 olduğunda, sistem Thunder/Phoenix/TweetMixer'dan gelen tüm gerçek zamanlı gönderi çekme mantığını atlar ve doğrudan önbelleğe alınmış içeriği döndürür.

Bu şu anlama gelir: X'i günde düzinelerce kez açan yoğun kullanıcılar için, isteklerinin çoğu öneri algoritmasından hiç geçmez; Redis önbelleğinde eski bir liste görürler.

Az önce gönderdiğiniz bir gönderi, bu yoğun kullanıcılar için tamamen görünmez olabilir. İçeriğinizin bir şansı ancak önbellek bir sonraki yenilemesinde girer.

Bu aynı zamanda mantığa aykırı bir olguyu da açıklıyor: Bazı hesaplar günde düzinelerce kez gönderi yayınlıyor ve trafikleri fena değil. Bunun nedeni, yüksek frekanslı yayının "belirli bir önbellek yenilemesinde seçilme" olasılığını artırmasıdır. Ancak Punk2898, bu stratejinin daha sonra ayarlanacağını tahmin ediyor.

Sıradan yaratıcılar için öneri: Hedef kitlenizin en yoğun olduğu zamandan 10-30 dakika önce yayın yapın, böylece gönderinizin önbellek yenilendiğinde dahil edilme şansı daha yüksek olur.

Gözlem 7: MediumRisk, bilmediğiniz gizli ağırlık düşürmedir

Jason Zhu - inline image

Reklam sistemi kodu, brand_safety_verdict değişkenini ilk kez ortaya çıkardı. Dört seviyesi vardır: Safe / LowRisk / MediumRisk / HighRisk.

Anahtar bulgu: Varsayılan değer MediumRisk'tir MediumRisk.

Yani, gönderiniz Grox tarafından tam olarak incelenmemişse (veya etiketler eksikse), sistem size varsayılan olarak "Orta Risk" muamelesi yapar. Orta Risk gönderiler doğrudan engellenmez, ancak reklamların yanından kaçınılır. Reklamların etrafındaki konumlar ise genellikle yüksek maruziyetli alanlardır (kullanıcı görsel odak alanları).

Sonuç: Herhangi bir ihlal bildirimi almazsınız, ancak maruziyetiniz zaten indirime tabi tutulmuştur. Bu, v2 algoritmasındaki en kolay gözden kaçan "gizli gölge yasağı"dır.

Nasıl önlenir? Net temalara sahip ve "sivri" içerik barındırmayan gönderilerin hızlı bir şekilde Safe olarak sınıflandırılma olasılığı daha yüksektir. Önemli bir gönderi yayınladıktan sonra, ağır tanıtım yapmadan önce incelemenin bitmesi için 30-60 dakika bekleyin.

Yaratıcı Eylem Kontrol Listesi

Jason Zhu - inline image

Yukarıdaki 7 gözleme dayanarak, işte uygulanabilir adımlar:

İçerik Kalitesiyle İlgili

Her gönderinin ilk 10 kelimesi dwell veya not_dwelled'ı belirler. İlk cümlede bilişsel bir boşluk veya veri etkisi yaratmalısınız. "Bugün küçük bir ipucu öğrendim" ile başlamak doğrudan kaydırarak geçmeyi tetikler.

İçerik net argümanlara, bilgi yoğunluğuna ve bir yapı duygusuna sahip olmalıdır. 0,4 kalite puanı eşiği yüksek değildir, ancak "şablon + düşük bilgi + bir resimle birkaç kelime" doldurma gönderileri kesinlikle geçemez.

AI şablon hissinden kaçının: Tekdüze cümle yapıları, sabit başlangıçlar ("Önce... İkinci olarak... Son olarak") ve büyük bitişler slop_score tarafından tespit edilecektir.

Çevre Operasyonlarıyla İlgili

Takip listenizi denetleyin. Hedef çevrenizde olmayan rastgele hesapları takipten çıkarın. Her takip, Jaccard katsayınızı şekillendirir.

Hedef çevrenizdeki 5-10 temel hesapla karşılıklı takipleşin. Karşılıklı takip ağırlığı, tek yönlü takiplerden çok daha yüksektir.

Çevredeki büyük V'lerin gönderilerine bilgi artışı sağlayan yorumlar bırakın. "Öğrendim" değil, bir veri noktası ekleyin, bir karşı örnek paylaşın veya bir genişletme sorusu sorun.

Yorum Bölümü Yönetimiyle İlgili

Gönderilerinizin altındaki spam yorumları düzenli olarak temizleyin. Reklamlar ve anlamsız yanıtlar ana gönderinin ağırlığını düşürür.

İlgisiz gönderilerin altına spamlama yapmayın. 0 puanlı yorumlar hesabınızda bir spam kaydı bırakır.

Yayın Zamanlamasıyla İlgili

Hedef kitlenizin en yoğun olduğu zamandan 10-30 dakika önce yayın yapın. Önbellek yenilemesinin sizi dahil etmesi için bir pencere bırakın.

Önemli bir gönderiden sonra tanıtım yapmak için 30-60 dakika bekleyin. Grox incelemesinin bitmesine izin vererek varsayılan MediumRisk'ten Safe'e yükseltin.

Alıntı Retweet'leriyle İlgili

Marjinal içeriği alıntılarken dikkatli olun. v2 VF müşterek sorumluluk mekanizması, cezalandırılan gönderilerden kaynaklanan ağırlık düşürmenin alıntı zinciri boyunca size yayılmasına neden olur.

Tartışmalı içerik için doğrudan alıntı yerine ekran görüntüleri + kendi yorumlarınızı kullanın.

Etiketlerle İlgili

1-2 temel Grok konusu belirleyin ve tutarlı bir şekilde bunlar etrafında içerik üretin. Yeni kullanıcıların keşif akışları konuya göre sıkı bir şekilde filtrelenir; eğer onların konu kümesinde değilseniz, onlar için var olmazsınız.

Ara sıra net # etiketleri kullanarak algoritmanın konu sınıflandırmasını güçlendirin.

Videoyla İlgili

Bir videonun ilk 1 saniyesi yaşam-ölüm çizgisidir. not_dwelled sinyali en belirgin şekilde videolarda görülür.

Önemli içerik mutlaka metin yalnız sürümüne sahip olmalıdır. Bazı kullanıcıların "daha az video gör" filtreleri etkindir ve video süresi alanına sahip gönderiler tamamen kesilir.

Referans bağlantıları:

https://github.com/xai-org/x-algorithm

Save to YouMind

Use YouMind to read viral articles deeply

Save the source, ask focused questions, summarize the argument, and turn a viral article into reusable notes in one AI workspace.

Explore YouMind

Çözülecek daha fazla kalıp

Son viral makaleler

Daha fazla viral makale keşfet