मैंने X के ओपन-सोर्स एल्गोरिदम को चलाया और 7 ऐसे वेरिएबल खोजे जिन्हें क्रिएटर्स नियंत्रित कर सकते हैं

@GoSailGlobal
चीनी2 माह पहले · 16 मई 2026
542K
18
0
6
17

TL;DR

X के मई एल्गोरिदम अपडेट का विश्लेषण यह बताता है कि क्वालिटी स्कोर, ड्वेल टाइम और कम्युनिटी सर्कल वितरण को कैसे प्रभावित करते हैं, जो क्रिएटर्स के लिए एक रोडमैप प्रदान करता है।

मैंने X के रेकमेंडेशन एल्गोरिदम को चलाया, जो मई में ओपन-सोर्स किया गया था, और पाया कि ओपन-सोर्स भाग वास्तविक Feed रैंकिंग का केवल 30% ही समझाता है। बाकी 70% सर्वर-साइड कॉन्फ़िगरेशन, VM Ranker और ऑपरेशनल नियमों में छिपा है।

लेकिन यह 30% पब्लिक कोड एक सवाल का जवाब देने के लिए काफी है: निर्माता वास्तव में क्या नियंत्रित कर सकते हैं?

मूल रिपॉजिटरी: xai-org/x-algorithm (15 मई को अपडेट, 187 फ़ाइलें और 18,263 लाइनें कोड जोड़ी गईं)

यह लेख एल्गोरिदम का अवलोकन नहीं दोहराएगा (Punk2898 की दो पोस्ट पहले से ही बहुत पूर्ण हैं), बल्कि तीन चीज़ों पर ध्यान केंद्रित करेगा:

1️⃣ पाइपलाइन चलाते समय मैंने जो प्रतिज्ञात्मक घटनाएँ देखीं

2️⃣ मई कोड अपडेट में वे तंत्र जिनका निर्माताओं पर सबसे अधिक प्रभाव होता है

3️⃣ इन अवलोकनों के आधार पर विशिष्ट परिचालन सुझाव

अवलोकन 1: ओपन-सोर्स रैंकिंग और वास्तविक Feed के बीच लगभग शून्य सहसंबंध

Jason Zhu - inline image

मैंने Phoenix मॉडल का उपयोग करके 537,000 स्पोर्ट्स पोस्ट का कोरपस चलाया। मॉडल द्वारा दी गई अंतिम स्कोर सीमा 0.0000 से 0.0015 तक थी, बेहद सपाट। Fav, Reply और RT के लिए अनुमानित प्रायिकताएँ सभी शून्य के करीब थीं; रैंकिंग मुख्य रूप से Dwell (रुकने का समय) को अंतर पैदा करने के लिए सिग्नल के रूप में उपयोग करती थी।

फिर मैंने तुलना के लिए वास्तविक For You Feed को स्क्रैप किया। Kendall's tau का उपयोग करके रैंक कोरिलेशन की गणना करने पर परिणाम -0.10 आया।

इस संख्या का मतलब है: ओपन-सोर्स कोड (fav1.0 + reply0.5 + RT0.3 + dwell0.2) में डेमो वज़न का उपयोग करके आपके द्वारा देखी जाने वाली वास्तविक Feed रैंकिंग का अनुमान लगाना लगभग यादृच्छिक अनुमान जितना ही सटीक है।

वास्तविक Feed में, शीर्ष 7 में शून्य इंटरैक्शन वाली पोस्ट दिखाई देती हैं, जबकि उच्च इंटरैक्शन वाली पोस्ट 9वें या 10वें स्थान पर धकेल दी जाती हैं। 3 मिनट के भीतर प्रकाशित बिल्कुल नई पोस्ट, जिनमें शून्य इंटरैक्शन है, भी Feed में प्रवेश कर सकती हैं।

इसका क्या मतलब है?

इसका मतलब है कि ओपन-सोर्स Phoenix मॉडल केवल "प्रारंभिक उम्मीदवार स्क्रीनिंग" के लिए जिम्मेदार है। किसी और के Feed में आपकी रैंक वास्तव में क्या निर्धारित करता है, वह बाद के पुनः-रैंकिंग स्तर हैं। मई में ओपन-सोर्स किया गया कोड इन पुनः-रैंकिंग स्तरों के तर्क को पूरा करता है।

अवलोकन 2: 0.4 का गुणवत्ता स्कोर जीवन और मृत्यु की अदृश्य रेखा है

Jason Zhu - inline image

मई में नया जोड़ा गया Grox मॉड्यूल इस अपडेट का सबसे महत्वपूर्ण हिस्सा है। यह Phoenix का प्रतिस्थापन नहीं है; यह Phoenix का अपस्ट्रीम आपूर्तिकर्ता है। हर नई पोस्ट भेजे जाने के बाद, Grox एक VLM लार्ज मॉडल का उपयोग करके 5 काम करता है:

  • गुणवत्ता स्कोर असाइन करना (quality_score, 0 से 1)
  • 7 बूलियन टैग (एडल्ट कंटेंट, हिंसा, नफरत भाषण, आदि) जनरेट करना
  • स्लॉप स्कोर असाइन करना (slop_score, स्तर 1-3-1)
  • मल्टीमॉडल एम्बेडिंग वेक्टर जनरेट करना
  • PTOS सुरक्षा समीक्षा करना

कोड स्पष्ट रूप से बताता है: प्रारंभिक स्क्रीनिंग पास करने के लिए quality_score >= 0.4 आवश्यक है। 0.4 से नीचे की कोई भी चीज़ "निम्न गुणवत्ता" के रूप में चिह्नित की जाती है, और आगे का वितरण हर जगह बाधित होता है।

यह 0.4 सीमा VLM मॉडल द्वारा तय की जाती है, न कि कीवर्ड मिलान द्वारा। यह आपके टेक्स्ट का अर्थ, आपकी छवियों की सामग्री और वीडियो फ़्रेम को समझ सकता है। नियम प्रणालियाँ जिन्हें पहले "छवियाँ जोड़कर और कीवर्ड स्टैक करके" धोखा दिया जा सकता था, अब काम नहीं करतीं।

slop_score एक और नया हथियार है: टेम्पलेटेड सामग्री, कम सूचना घनत्व और स्पष्ट AI-जनित निशान वाली पोस्ट को उच्च स्कोर मिलेगा। स्तर 1 सामान्य है; स्तर 2-3 का मतलब है कि एल्गोरिदम सोचता है कि आप सामग्री को "पतला" कर रहे हैं।

अवलोकन 3: स्वाइप करना एक सक्रिय दंड है, सिर्फ "न देखना" नहीं

Jason Zhu - inline image

मई के वर्जन ने व्यवहारिक सिग्नल को 18 डिस्क्रीट हेड्स से 19 डिस्क्रीट हेड्स + 8 कंटीन्यूअस ऑक्सिलरी हेड्स में अपग्रेड किया। नए कंटीन्यूअस हेड्स "कितनी देर रुके" और "पढ़ने की पूर्णता दर" जैसे बारीक मैट्रिक्स का पूर्वानुमान लगाते हैं।

लेकिन निर्माताओं पर सबसे अधिक प्रभाव डालने वाला सिग्नल है: not_dwelled।

पहले हम सोचते थे कि "कोई उपयोगकर्ता इंटरैक्शन नहीं" तटस्थ है, जैसे न देखा जाना। गलत। उपयोगकर्ता द्वारा आपकी पोस्ट को जल्दी से स्वाइप करना एक सक्रिय नकारात्मक सिग्नल है, और एल्गोरिदम इसके लिए आपको दंडित करेगा।

इसका मतलब है:

  • वीडियो के पहले 1 सेकंड में ध्यान आकर्षित करने में विफलता = सक्रिय दंड
  • लंबी पोस्ट का पहला अरुचिकर वाक्य = सक्रिय दंड
  • दृश्य प्रभावहीन छवियाँ = सक्रिय दंड

वास्तविक Feed को देखते समय, मैंने एक घटना देखी: कुछ शून्य-इंटरैक्शन पोस्ट Top 7 में प्रवेश कर सकती हैं, जबकि कुछ उच्च-इंटरैक्शन पोस्ट को पीछे धकेल दिया जाता है। एक उचित व्याख्या यह है: वे शून्य-इंटरैक्शन पोस्ट, भले ही लाइक नहीं की गई, लेकिन उपयोगकर्ता वास्तव में उन पर रुके (dwell सिग्नल उत्पन्न किया), जबकि कुछ पोस्ट जो दिखती हैं कि उनका डेटा अच्छा है, वास्तव में बड़ी संख्या में त्वरित स्वाइप हुए।

अवलोकन 4: आप किसे फॉलो करते हैं, यह तय करता है कि एल्गोरिदम आपको किस सर्कल में रखता है

Jason Zhu - inline image

मई कोड में mutual_follow_jaccard_hydrator जोड़ा गया, जो "आपके और एक निश्चित लेखक के बीच आपसी फ़ॉलो सर्कल की समानता" की गणना करता है।

यदि आप और एक लेखक कई समान लोगों को फॉलो करते हैं (उच्च Jaccard गुणांक), तो एल्गोरिदम आपको उसी "सूचना सर्कल" में मानता है और आपको उनकी सामग्री दिखाने के लिए अधिक इच्छुक होता है।

यह तंत्र एक मूलभूत धारणा को बदलता है: पहले यह था कि "सामग्री की गुणवत्ता वितरण निर्धारित करती है"; अब यह है कि "सामग्री की गुणवत्ता + सर्कल से संबंधितता संयुक्त रूप से वितरण निर्धारित करते हैं।"

विशेष रूप से:

  • आपके द्वारा फॉलो किया गया हर खाता आपकी सर्कल पहचान की गणना करता है
  • बेतरतीब ढंग से फॉलो करना आपके सर्कल टैग को पतला करने के बराबर है
  • एक ही क्षेत्र के KOLs के साथ आपसी फॉलो 100 बेतरतीब खातों के एकतरफा फॉलो की तुलना में कहीं अधिक प्रभावी है
  • बड़ी V पोस्ट के तहत उच्च गुणवत्ता वाली टिप्पणियाँ following_replied_users सिग्नल श्रृंखला में प्रवेश करेंगी, और आपका अवतार "आप जिन लोगों को फॉलो करते हैं, वे यहाँ भी टिप्पणी करते हैं" संकेत में दिखाई दे सकता है

मेरा अपना For You Feed इसकी पुष्टि करता है: 60% से अधिक अनुशंसित सामग्री चीनी AI सर्कल के निर्माताओं से आती है क्योंकि मेरी फ़ॉलो सूची उस सर्कल में केंद्रित है।

अवलोकन 5: टिप्पणी अनुभाग अब एक स्वतंत्र ट्रैक है

Jason Zhu - inline image

मई कोड ने टिप्पणी अनुभाग के लिए एक स्वतंत्र स्कोरिंग प्रणाली का खुलासा किया। प्रत्येक टिप्पणी को Grok द्वारा 0-3 स्कोर किया जाता है:

  • 3 अंक: सूचना वृद्धि वाली टिप्पणियाँ जो चर्चा को ट्रिगर कर सकती हैं
  • 2 अंक: सामान्य इंटरैक्शन
  • 1 अंक: छोटी लेकिन स्पैम नहीं
  • 0 अंक: स्पैम टैग को ट्रिगर करता है, खाते की क्रेडिट को प्रभावित करता है

0-अंक वाली टिप्पणी सिर्फ़ कॉलैप्स नहीं होती; यह आपके खाते पर एक रिकॉर्ड छोड़ती है कि आपने "एक बार स्पैम टिप्पणी पोस्ट की थी।" लंबे समय तक संचय आपके समग्र खाते के वज़न को प्रभावित कर सकता है।

साथ ही, आपकी पोस्ट के तहत स्पैम टिप्पणियाँ मुख्य पोस्ट के वज़न को भी प्रभावित करती हैं। "फ़ॉलो फ़ॉर फ़ॉलो," "पहला," या "+1" जैसी टिप्पणियाँ — एल्गोरिदम सिर्फ नापसंद नहीं करता; वह उनके कारण आपकी मु पोस्ट के वितरण को कम कर देता है।

इसके विपरीत, एक उच्च गुणवत्ता वाली टिप्पणी का एक्सपोज़र मूल्य आपके 10 सामान्य पोस्ट करने से अधिक हो सकता है। किसी बड़ी V की पोस्ट के तहत डेटा-समर्थित, चर्चा को ट्रिगर करने वाली टिप्पणी छोड़ी छोड़ना बड़ी V के ट्रैफ़िक प्रवेश द्वार को उधार लेने के बराबर है।

अवलोकन 6: कैशिंग रणनीतियाँ "कब पोस्ट करना है" को "क्या पोस्ट करना है" से अधिक सूक्ष्म बनाती हैं

Jason Zhu - inline image

कोड में एक विवरण है: जब कैश पूल में पोस्ट की संख्या >= 500 होती है, तो सिस्टम Thunder/Phoenix/TweetMixer से सभी रीयल-टाइम पोस्ट-पुलिंग तर्क को छोड़ देता है और सीधे कैश की गई सामग्री लौटाता है।

इसका मतलब है: जो हैवी उपयोगकर्ता दिन में दर्जनों बार X खोलते हैं, उनके कई अनुरोध बिल्कुल भी रेकमेंडेशन एल्गो Al्गोरिदम से नहीं गुज़रते; वे Redis कैश में एक पुरानी सूची देखते हैं।

आपके द्वारा अभी भेजी गई पोस्ट इन हैवी उपयोगकर्ताओं के लिए पूरी तरह से अदृश्य हो सकती है। आपकी सामग्री को अगली बार कैश रिफ़्रेश होने पर ही प्रवेश करने का मौका मिलता है।

यह एक प्रतिज्ञात्मक घटना की भी व्याख्या करता है: कुछ खाते दिन में दर्जनों बार पोस्ट करते हैं, और उनका ट्रैफ़िक खराब नहीं है। ऐसा इसलिए है क्योंकि उच्च-आवृत्ति पोस्टिंग "एक निश्चित कैश रिफ़्रेश में चुने जाने" की संभ्मावना को बढ़ाती है। हालांकि, Punk2898 भविष्यवाणी करता है कि इस रणनीति को बाद में समायोजित किया जाएगा।

सामान्य निर्माताओं के लिए सुझाव है: अपने लक्षित दर्शकों की चरम गतिविधि से 10-30 मिनट पहले पोस्ट करें, ताकि कैश रिफ़्रेश होने पर आपकी पोस्ट के शामिल होने की बेहतर संभावना हो।

अवलोकन 7: MediumRisk एक छिपा हुआ वज़न कमी है जिसके बारे में आप नहीं जानते

Jason Zhu - inline image

विज्ञापन प्रणाली कोड ने पहली बार brand_safety_verdict चर का खुलासा किया। इसके चार स्तर हैं: Safe / LowRisk / MediumRisk / HighRisk।

मु खोज: डिफ़ॉल्ट मान MediumRisk है।

दूसरे शब्दों में, यदि आपकी पोस्ट की Grox द्वारा पूरी तरह समीक्षा नहीं की गई है (या टैग गायब हैं), तो सिस्टम आपको डिफ़ॉल्ट रूप से "Medium Risk" मानता है। Medium Risk पोस्ट को सीधे ब्लॉक नहीं किया जाता, बल्कि वे विज्ञापनों के बगल में रखे जाने से बचाए जाते हैं। और विज्ञापनों के आस-पास के स्थान अक्सर उच्च-एक्सपोज़र वाले क्षेत्र (उपयोगकर्ता का दृश्य फ़ोकस क्षेत्र) होते हैं।

परिणाम: आपको कभी कोई उल्लंघन सूचना नहीं मिलती, लेकिन आपका एक्सपोज़र पहले से ही कम किया जा रहा है। v2 एल्गोरिदम में यह सबसे आसानी से उपेक्षित "छिपा हुआ शैडोबैन" है।

इससे कैसे बचें? स्पष्ट विषयों और कोई "एजी" सामग्री नहीं वाली पोस्ट को जल्दी Safe के रूप में वर्गीकृत किए जाने की अधिक संभावना है। एक महत्वपूर्ण पोस्ट डालने के बाद, भारी प्रमोशन करने से पहले समीक्षा समाप्त होने के लिए 30-60 मिनट प्रतीक्षा करें।

निर्माता कार्रवाई चेकलिस्ट

Jason Zhu - inline image

उपरोक्त 7 अवलोकनों के आधार पर, यहां विशिष्ट कार्रवाई योग्य कदम हैं:

सामग्री गुणवत्ता के संबंध में

प्रत्येक पोस्ट के पहले 10 शब्द dwell या not_dwelled का निर्धारण करते हैं। पहले वाक्य में एक संज्ञानात्मक अंतर या डेटा प्रभाव बनाना आवश्यक है। "आज मैंने एक छोटी सी ट्रिक सीखी" से शुरू करना सीधे स्वाइप-अवे को ट्रिगर करता है।

सामग्री में स्पष्ट तर्क, सूचना घनत्व और संरचना की भावना होनी चाहिए। 0.4 गुणवत्ता स्कोर सीमा अधिक नहीं है, लेकिन "टेम्पलेटेड + कम जानकारी + तस्वीर के साथ कुछ शब्द" वाली फिलर पोस्ट निश्चित रूप से पास नहीं होंगी।

AI टेम्पलेट फील से बचें: समान वाक्य संरचनाएं, निश्चित शुरुआत ("पहला... दूसरा... अंत में") और भव्य समापन slop_score द्वारा पकड़े जाएंगे।

सर्कल संचालन के संबंध में

अपनी फ़ॉलो सूची का ऑडिट करें। अपने लक्ष्य सर्कल में नहीं आने वाले बेतरतीब खातों को अनफ़ॉलो करें। प्रत्येक फ़ॉलो आपके Jaccard गुणांक को आकार देता है।

अपने लक्ष्य सर्कल में 5-10 मु खातों को आपसी रूप से फॉलो करें। आपसी फ़ॉलो का वज़न एकतरफा फ़ॉलो से कहीं अधिक होता है।

सर्कल की बड़ी V पोस्ट में सूचना वृद्धि वाली टिप्पणियाँ छोड़ें। "सीखा" नहीं, बल्कि एक डेटा बिंदु का पूरक बनाएं, एक काउंटर-उदाहरण साझा करें, या एक विस्तार प्रश्न पूछें।

टिप्पणी अनुभाग प्रबंधन के संबंध में

अपनी पोस्ट के तहत स्पैम टिप्पणियों को नियमित रूप से साफ करें। विज्ञापन और अर्थहीन उत्तर मु पोस्ट के वज़न को कम कर देंगे।

अप्रासंगिक पोस्ट के तहत अपनी उपस्थिति स्पैम न करें। 0-अंक वाली टिप्पणी आपके खाते पर एक स्पैम रिकॉर्ड छोड़ती है।

पोस्टिंग समय के संबंध में

अपने लक्षित दर्शकों की चरम गतिविधि से 10-30 मिनट पहले पोस्ट करें। कैश रिफ़्रेश को आपको शामिल करने के लिए एक विंडो छोड़ दें।

एक महत्वपूर्ण पोस्ट के बाद उसे प्रमोट करने से पहले 30-60 मिनट प्रतीक्षा करें। डिफ़ॉल्ट MediumRisk से Safe में अपग्रेड होने के लिए Grox समीक्षा को समाप्त होने दें।

कोट रीट्वीट के संबंध में

मार्जिनल सामग्री को कोट करने में सावधानी बरतें। v2 VF संयुक्त देयता तंत्र के कारण दंडित पोस्ट से वज़न कमी कोट श्रृंखला के साथ आप तक फैल जाएगा।

विवादास्पद सामग्री के लिए सीधे कोट के बजाय स्क्रीनशॉट + अपनी टिप्पणी का उपयोग करें।

हैशटैग के संबंध में

1-2 मु Grok विषयों की पहचान करें और उनके आस-पास लगातार सामग्री बनाएंदाएं। नए उपयोगकर्ताओं की डिस्कवरी स्ट्रीम विषय द्वारा सख्ती से फ़िल्टर की जाती है; यदि आप उनके विषय सेट में नहीं हैं, तो आप उनके लिए मौजूद नहीं हैं।

कभी-कभी # explicit टैग का उपयोग करके एल्गोरिदम के विषय वर्गीकरण को मजबूत करें।

वीडियो के संबंध में

वीडियो का पहला 1 सेकंड जीवन और मृत्यु की रेखा है। not_dwelled सिग्नल वीडियो में सबसे अधिक स्पष्ट है।

महत्वपूर्ण सामग्री में टेक्स्ट-ओनली वर्जन होना चाहिए। कुछ उपयोगकर्ताओं ने "कम वीडियो देखें" फ़िल्टर सक्षम किया है, और वीडियो अवधि फ़ील्ड वाली पोस्ट पूरी तरह से काट दी जाएंगी।

संदर्भ लिंक:

https://github.com/xai-org/x-algorithm

https://x.com/punk2898/status/2013538743467286981

[[https://x.com/punk2898/status/2055439323693289598](https 2061:10:https]

Save to YouMind

Use YouMind to read viral articles deeply

Save the source, ask focused questions, summarize the argument, and turn a viral article into reusable notes in one AI workspace.

Explore YouMind

समझने के लिए और पैटर्न

हाल के वायरल लेख

और वायरल लेख देखें