मैंने X के ओपन-सोर्स एल्गोरिदम को चलाया और 7 ऐसे वेरिएबल खोजे जिन्हें क्रिएटर्स नियंत्रित कर सकते हैं

मैंने X के रेकमेंडेशन एल्गोरिदम को चलाया, जो मई में ओपन-सोर्स किया गया था, और पाया कि ओपन-सोर्स भाग वास्तविक Feed रैंकिंग का केवल 30% ही समझाता है। बाकी 70% सर्वर-साइड कॉन्फ़िगरेशन, VM Ranker और ऑपरेशनल नियमों में छिपा है।

लेकिन यह 30% पब्लिक कोड एक सवाल का जवाब देने के लिए काफी है: निर्माता वास्तव में क्या नियंत्रित कर सकते हैं?

मूल रिपॉजिटरी: xai-org/x-algorithm (15 मई को अपडेट, 187 फ़ाइलें और 18,263 लाइनें कोड जोड़ी गईं)

यह लेख एल्गोरिदम का अवलोकन नहीं दोहराएगा (Punk2898 की दो पोस्ट पहले से ही बहुत पूर्ण हैं), बल्कि तीन चीज़ों पर ध्यान केंद्रित करेगा:

1️⃣ पाइपलाइन चलाते समय मैंने जो प्रतिज्ञात्मक घटनाएँ देखीं

2️⃣ मई कोड अपडेट में वे तंत्र जिनका निर्माताओं पर सबसे अधिक प्रभाव होता है

3️⃣ इन अवलोकनों के आधार पर विशिष्ट परिचालन सुझाव

अवलोकन 1: ओपन-सोर्स रैंकिंग और वास्तविक Feed के बीच लगभग शून्य सहसंबंध

मैंने Phoenix मॉडल का उपयोग करके 537,000 स्पोर्ट्स पोस्ट का कोरपस चलाया। मॉडल द्वारा दी गई अंतिम स्कोर सीमा 0.0000 से 0.0015 तक थी, बेहद सपाट। Fav, Reply और RT के लिए अनुमानित प्रायिकताएँ सभी शून्य के करीब थीं; रैंकिंग मुख्य रूप से Dwell (रुकने का समय) को अंतर पैदा करने के लिए सिग्नल के रूप में उपयोग करती थी।

फिर मैंने तुलना के लिए वास्तविक For You Feed को स्क्रैप किया। Kendall's tau का उपयोग करके रैंक कोरिलेशन की गणना करने पर परिणाम -0.10 आया।

इस संख्या का मतलब है: ओपन-सोर्स कोड (fav1.0 + reply0.5 + RT0.3 + dwell0.2) में डेमो वज़न का उपयोग करके आपके द्वारा देखी जाने वाली वास्तविक Feed रैंकिंग का अनुमान लगाना लगभग यादृच्छिक अनुमान जितना ही सटीक है।

वास्तविक Feed में, शीर्ष 7 में शून्य इंटरैक्शन वाली पोस्ट दिखाई देती हैं, जबकि उच्च इंटरैक्शन वाली पोस्ट 9वें या 10वें स्थान पर धकेल दी जाती हैं। 3 मिनट के भीतर प्रकाशित बिल्कुल नई पोस्ट, जिनमें शून्य इंटरैक्शन है, भी Feed में प्रवेश कर सकती हैं।

इसका क्या मतलब है?

इसका मतलब है कि ओपन-सोर्स Phoenix मॉडल केवल "प्रारंभिक उम्मीदवार स्क्रीनिंग" के लिए जिम्मेदार है। किसी और के Feed में आपकी रैंक वास्तव में क्या निर्धारित करता है, वह बाद के पुनः-रैंकिंग स्तर हैं। मई में ओपन-सोर्स किया गया कोड इन पुनः-रैंकिंग स्तरों के तर्क को पूरा करता है।

अवलोकन 2: 0.4 का गुणवत्ता स्कोर जीवन और मृत्यु की अदृश्य रेखा है

मई में नया जोड़ा गया Grox मॉड्यूल इस अपडेट का सबसे महत्वपूर्ण हिस्सा है। यह Phoenix का प्रतिस्थापन नहीं है; यह Phoenix का अपस्ट्रीम आपूर्तिकर्ता है। हर नई पोस्ट भेजे जाने के बाद, Grox एक VLM लार्ज मॉडल का उपयोग करके 5 काम करता है:

गुणवत्ता स्कोर असाइन करना (quality_score, 0 से 1)
7 बूलियन टैग (एडल्ट कंटेंट, हिंसा, नफरत भाषण, आदि) जनरेट करना
स्लॉप स्कोर असाइन करना (slop_score, स्तर 1-3-1)
मल्टीमॉडल एम्बेडिंग वेक्टर जनरेट करना
PTOS सुरक्षा समीक्षा करना

कोड स्पष्ट रूप से बताता है: प्रारंभिक स्क्रीनिंग पास करने के लिए quality_score >= 0.4 आवश्यक है। 0.4 से नीचे की कोई भी चीज़ "निम्न गुणवत्ता" के रूप में चिह्नित की जाती है, और आगे का वितरण हर जगह बाधित होता है।

यह 0.4 सीमा VLM मॉडल द्वारा तय की जाती है, न कि कीवर्ड मिलान द्वारा। यह आपके टेक्स्ट का अर्थ, आपकी छवियों की सामग्री और वीडियो फ़्रेम को समझ सकता है। नियम प्रणालियाँ जिन्हें पहले "छवियाँ जोड़कर और कीवर्ड स्टैक करके" धोखा दिया जा सकता था, अब काम नहीं करतीं।

slop_score एक और नया हथियार है: टेम्पलेटेड सामग्री, कम सूचना घनत्व और स्पष्ट AI-जनित निशान वाली पोस्ट को उच्च स्कोर मिलेगा। स्तर 1 सामान्य है; स्तर 2-3 का मतलब है कि एल्गोरिदम सोचता है कि आप सामग्री को "पतला" कर रहे हैं।

अवलोकन 3: स्वाइप करना एक सक्रिय दंड है, सिर्फ "न देखना" नहीं

मई के वर्जन ने व्यवहारिक सिग्नल को 18 डिस्क्रीट हेड्स से 19 डिस्क्रीट हेड्स + 8 कंटीन्यूअस ऑक्सिलरी हेड्स में अपग्रेड किया। नए कंटीन्यूअस हेड्स "कितनी देर रुके" और "पढ़ने की पूर्णता दर" जैसे बारीक मैट्रिक्स का पूर्वानुमान लगाते हैं।

लेकिन निर्माताओं पर सबसे अधिक प्रभाव डालने वाला सिग्नल है: not_dwelled।

पहले हम सोचते थे कि "कोई उपयोगकर्ता इंटरैक्शन नहीं" तटस्थ है, जैसे न देखा जाना। गलत। उपयोगकर्ता द्वारा आपकी पोस्ट को जल्दी से स्वाइप करना एक सक्रिय नकारात्मक सिग्नल है, और एल्गोरिदम इसके लिए आपको दंडित करेगा।

इसका मतलब है:

वीडियो के पहले 1 सेकंड में ध्यान आकर्षित करने में विफलता = सक्रिय दंड
लंबी पोस्ट का पहला अरुचिकर वाक्य = सक्रिय दंड
दृश्य प्रभावहीन छवियाँ = सक्रिय दंड

वास्तविक Feed को देखते समय, मैंने एक घटना देखी: कुछ शून्य-इंटरैक्शन पोस्ट Top 7 में प्रवेश कर सकती हैं, जबकि कुछ उच्च-इंटरैक्शन पोस्ट को पीछे धकेल दिया जाता है। एक उचित व्याख्या यह है: वे शून्य-इंटरैक्शन पोस्ट, भले ही लाइक नहीं की गई, लेकिन उपयोगकर्ता वास्तव में उन पर रुके (dwell सिग्नल उत्पन्न किया), जबकि कुछ पोस्ट जो दिखती हैं कि उनका डेटा अच्छा है, वास्तव में बड़ी संख्या में त्वरित स्वाइप हुए।

अवलोकन 4: आप किसे फॉलो करते हैं, यह तय करता है कि एल्गोरिदम आपको किस सर्कल में रखता है

मई कोड में mutual_follow_jaccard_hydrator जोड़ा गया, जो "आपके और एक निश्चित लेखक के बीच आपसी फ़ॉलो सर्कल की समानता" की गणना करता है।

यदि आप और एक लेखक कई समान लोगों को फॉलो करते हैं (उच्च Jaccard गुणांक), तो एल्गोरिदम आपको उसी "सूचना सर्कल" में मानता है और आपको उनकी सामग्री दिखाने के लिए अधिक इच्छुक होता है।

यह तंत्र एक मूलभूत धारणा को बदलता है: पहले यह था कि "सामग्री की गुणवत्ता वितरण निर्धारित करती है"; अब यह है कि "सामग्री की गुणवत्ता + सर्कल से संबंधितता संयुक्त रूप से वितरण निर्धारित करते हैं।"

विशेष रूप से:

आपके द्वारा फॉलो किया गया हर खाता आपकी सर्कल पहचान की गणना करता है
बेतरतीब ढंग से फॉलो करना आपके सर्कल टैग को पतला करने के बराबर है
एक ही क्षेत्र के KOLs के साथ आपसी फॉलो 100 बेतरतीब खातों के एकतरफा फॉलो की तुलना में कहीं अधिक प्रभावी है
बड़ी V पोस्ट के तहत उच्च गुणवत्ता वाली टिप्पणियाँ following_replied_users सिग्नल श्रृंखला में प्रवेश करेंगी, और आपका अवतार "आप जिन लोगों को फॉलो करते हैं, वे यहाँ भी टिप्पणी करते हैं" संकेत में दिखाई दे सकता है

मेरा अपना For You Feed इसकी पुष्टि करता है: 60% से अधिक अनुशंसित सामग्री चीनी AI सर्कल के निर्माताओं से आती है क्योंकि मेरी फ़ॉलो सूची उस सर्कल में केंद्रित है।

अवलोकन 5: टिप्पणी अनुभाग अब एक स्वतंत्र ट्रैक है

मई कोड ने टिप्पणी अनुभाग के लिए एक स्वतंत्र स्कोरिंग प्रणाली का खुलासा किया। प्रत्येक टिप्पणी को Grok द्वारा 0-3 स्कोर किया जाता है:

3 अंक: सूचना वृद्धि वाली टिप्पणियाँ जो चर्चा को ट्रिगर कर सकती हैं
2 अंक: सामान्य इंटरैक्शन
1 अंक: छोटी लेकिन स्पैम नहीं
0 अंक: स्पैम टैग को ट्रिगर करता है, खाते की क्रेडिट को प्रभावित करता है

0-अंक वाली टिप्पणी सिर्फ़ कॉलैप्स नहीं होती; यह आपके खाते पर एक रिकॉर्ड छोड़ती है कि आपने "एक बार स्पैम टिप्पणी पोस्ट की थी।" लंबे समय तक संचय आपके समग्र खाते के वज़न को प्रभावित कर सकता है।

साथ ही, आपकी पोस्ट के तहत स्पैम टिप्पणियाँ मुख्य पोस्ट के वज़न को भी प्रभावित करती हैं। "फ़ॉलो फ़ॉर फ़ॉलो," "पहला," या "+1" जैसी टिप्पणियाँ — एल्गोरिदम सिर्फ नापसंद नहीं करता; वह उनके कारण आपकी मु पोस्ट के वितरण को कम कर देता है।

इसके विपरीत, एक उच्च गुणवत्ता वाली टिप्पणी का एक्सपोज़र मूल्य आपके 10 सामान्य पोस्ट करने से अधिक हो सकता है। किसी बड़ी V की पोस्ट के तहत डेटा-समर्थित, चर्चा को ट्रिगर करने वाली टिप्पणी छोड़ी छोड़ना बड़ी V के ट्रैफ़िक प्रवेश द्वार को उधार लेने के बराबर है।

अवलोकन 6: कैशिंग रणनीतियाँ "कब पोस्ट करना है" को "क्या पोस्ट करना है" से अधिक सूक्ष्म बनाती हैं

कोड में एक विवरण है: जब कैश पूल में पोस्ट की संख्या >= 500 होती है, तो सिस्टम Thunder/Phoenix/TweetMixer से सभी रीयल-टाइम पोस्ट-पुलिंग तर्क को छोड़ देता है और सीधे कैश की गई सामग्री लौटाता है।

इसका मतलब है: जो हैवी उपयोगकर्ता दिन में दर्जनों बार X खोलते हैं, उनके कई अनुरोध बिल्कुल भी रेकमेंडेशन एल्गो Al्गोरिदम से नहीं गुज़रते; वे Redis कैश में एक पुरानी सूची देखते हैं।

आपके द्वारा अभी भेजी गई पोस्ट इन हैवी उपयोगकर्ताओं के लिए पूरी तरह से अदृश्य हो सकती है। आपकी सामग्री को अगली बार कैश रिफ़्रेश होने पर ही प्रवेश करने का मौका मिलता है।

यह एक प्रतिज्ञात्मक घटना की भी व्याख्या करता है: कुछ खाते दिन में दर्जनों बार पोस्ट करते हैं, और उनका ट्रैफ़िक खराब नहीं है। ऐसा इसलिए है क्योंकि उच्च-आवृत्ति पोस्टिंग "एक निश्चित कैश रिफ़्रेश में चुने जाने" की संभ्मावना को बढ़ाती है। हालांकि, Punk2898 भविष्यवाणी करता है कि इस रणनीति को बाद में समायोजित किया जाएगा।

सामान्य निर्माताओं के लिए सुझाव है: अपने लक्षित दर्शकों की चरम गतिविधि से 10-30 मिनट पहले पोस्ट करें, ताकि कैश रिफ़्रेश होने पर आपकी पोस्ट के शामिल होने की बेहतर संभावना हो।

अवलोकन 7: MediumRisk एक छिपा हुआ वज़न कमी है जिसके बारे में आप नहीं जानते

विज्ञापन प्रणाली कोड ने पहली बार brand_safety_verdict चर का खुलासा किया। इसके चार स्तर हैं: Safe / LowRisk / MediumRisk / HighRisk।

मु खोज: डिफ़ॉल्ट मान MediumRisk है।

दूसरे शब्दों में, यदि आपकी पोस्ट की Grox द्वारा पूरी तरह समीक्षा नहीं की गई है (या टैग गायब हैं), तो सिस्टम आपको डिफ़ॉल्ट रूप से "Medium Risk" मानता है। Medium Risk पोस्ट को सीधे ब्लॉक नहीं किया जाता, बल्कि वे विज्ञापनों के बगल में रखे जाने से बचाए जाते हैं। और विज्ञापनों के आस-पास के स्थान अक्सर उच्च-एक्सपोज़र वाले क्षेत्र (उपयोगकर्ता का दृश्य फ़ोकस क्षेत्र) होते हैं।

परिणाम: आपको कभी कोई उल्लंघन सूचना नहीं मिलती, लेकिन आपका एक्सपोज़र पहले से ही कम किया जा रहा है। v2 एल्गोरिदम में यह सबसे आसानी से उपेक्षित "छिपा हुआ शैडोबैन" है।

इससे कैसे बचें? स्पष्ट विषयों और कोई "एजी" सामग्री नहीं वाली पोस्ट को जल्दी Safe के रूप में वर्गीकृत किए जाने की अधिक संभावना है। एक महत्वपूर्ण पोस्ट डालने के बाद, भारी प्रमोशन करने से पहले समीक्षा समाप्त होने के लिए 30-60 मिनट प्रतीक्षा करें।

निर्माता कार्रवाई चेकलिस्ट

उपरोक्त 7 अवलोकनों के आधार पर, यहां विशिष्ट कार्रवाई योग्य कदम हैं:

सामग्री गुणवत्ता के संबंध में

प्रत्येक पोस्ट के पहले 10 शब्द dwell या not_dwelled का निर्धारण करते हैं। पहले वाक्य में एक संज्ञानात्मक अंतर या डेटा प्रभाव बनाना आवश्यक है। "आज मैंने एक छोटी सी ट्रिक सीखी" से शुरू करना सीधे स्वाइप-अवे को ट्रिगर करता है।

सामग्री में स्पष्ट तर्क, सूचना घनत्व और संरचना की भावना होनी चाहिए। 0.4 गुणवत्ता स्कोर सीमा अधिक नहीं है, लेकिन "टेम्पलेटेड + कम जानकारी + तस्वीर के साथ कुछ शब्द" वाली फिलर पोस्ट निश्चित रूप से पास नहीं होंगी।

AI टेम्पलेट फील से बचें: समान वाक्य संरचनाएं, निश्चित शुरुआत ("पहला... दूसरा... अंत में") और भव्य समापन slop_score द्वारा पकड़े जाएंगे।

सर्कल संचालन के संबंध में

अपनी फ़ॉलो सूची का ऑडिट करें। अपने लक्ष्य सर्कल में नहीं आने वाले बेतरतीब खातों को अनफ़ॉलो करें। प्रत्येक फ़ॉलो आपके Jaccard गुणांक को आकार देता है।

अपने लक्ष्य सर्कल में 5-10 मु खातों को आपसी रूप से फॉलो करें। आपसी फ़ॉलो का वज़न एकतरफा फ़ॉलो से कहीं अधिक होता है।

सर्कल की बड़ी V पोस्ट में सूचना वृद्धि वाली टिप्पणियाँ छोड़ें। "सीखा" नहीं, बल्कि एक डेटा बिंदु का पूरक बनाएं, एक काउंटर-उदाहरण साझा करें, या एक विस्तार प्रश्न पूछें।

टिप्पणी अनुभाग प्रबंधन के संबंध में

अपनी पोस्ट के तहत स्पैम टिप्पणियों को नियमित रूप से साफ करें। विज्ञापन और अर्थहीन उत्तर मु पोस्ट के वज़न को कम कर देंगे।

अप्रासंगिक पोस्ट के तहत अपनी उपस्थिति स्पैम न करें। 0-अंक वाली टिप्पणी आपके खाते पर एक स्पैम रिकॉर्ड छोड़ती है।

पोस्टिंग समय के संबंध में

अपने लक्षित दर्शकों की चरम गतिविधि से 10-30 मिनट पहले पोस्ट करें। कैश रिफ़्रेश को आपको शामिल करने के लिए एक विंडो छोड़ दें।

एक महत्वपूर्ण पोस्ट के बाद उसे प्रमोट करने से पहले 30-60 मिनट प्रतीक्षा करें। डिफ़ॉल्ट MediumRisk से Safe में अपग्रेड होने के लिए Grox समीक्षा को समाप्त होने दें।

कोट रीट्वीट के संबंध में

मार्जिनल सामग्री को कोट करने में सावधानी बरतें। v2 VF संयुक्त देयता तंत्र के कारण दंडित पोस्ट से वज़न कमी कोट श्रृंखला के साथ आप तक फैल जाएगा।

विवादास्पद सामग्री के लिए सीधे कोट के बजाय स्क्रीनशॉट + अपनी टिप्पणी का उपयोग करें।

हैशटैग के संबंध में

1-2 मु Grok विषयों की पहचान करें और उनके आस-पास लगातार सामग्री बनाएंदाएं। नए उपयोगकर्ताओं की डिस्कवरी स्ट्रीम विषय द्वारा सख्ती से फ़िल्टर की जाती है; यदि आप उनके विषय सेट में नहीं हैं, तो आप उनके लिए मौजूद नहीं हैं।

कभी-कभी # explicit टैग का उपयोग करके एल्गोरिदम के विषय वर्गीकरण को मजबूत करें।

वीडियो के संबंध में

वीडियो का पहला 1 सेकंड जीवन और मृत्यु की रेखा है। not_dwelled सिग्नल वीडियो में सबसे अधिक स्पष्ट है।

महत्वपूर्ण सामग्री में टेक्स्ट-ओनली वर्जन होना चाहिए। कुछ उपयोगकर्ताओं ने "कम वीडियो देखें" फ़िल्टर सक्षम किया है, और वीडियो अवधि फ़ील्ड वाली पोस्ट पूरी तरह से काट दी जाएंगी।

संदर्भ लिंक:

https://github.com/xai-org/x-algorithm

https://x.com/punk2898/status/2013538743467286981

[[https://x.com/punk2898/status/2055439323693289598](https 2061:10:https]

मैंने X के ओपन-सोर्स एल्गोरिदम को चलाया और 7 ऐसे वेरिएबल खोजे जिन्हें क्रिएटर्स नियंत्रित कर सकते हैं

अवलोकन 1: ओपन-सोर्स रैंकिंग और वास्तविक Feed के बीच लगभग शून्य सहसंबंध

अवलोकन 2: 0.4 का गुणवत्ता स्कोर जीवन और मृत्यु की अदृश्य रेखा है

अवलोकन 3: स्वाइप करना एक सक्रिय दंड है, सिर्फ "न देखना" नहीं

अवलोकन 4: आप किसे फॉलो करते हैं, यह तय करता है कि एल्गोरिदम आपको किस सर्कल में रखता है

अवलोकन 5: टिप्पणी अनुभाग अब एक स्वतंत्र ट्रैक है

अवलोकन 6: कैशिंग रणनीतियाँ "कब पोस्ट करना है" को "क्या पोस्ट करना है" से अधिक सूक्ष्म बनाती हैं

अवलोकन 7: MediumRisk एक छिपा हुआ वज़न कमी है जिसके बारे में आप नहीं जानते

निर्माता कार्रवाई चेकलिस्ट

Use YouMind to read viral articles deeply

हाल के वायरल लेख

जापानी बड़ी कंपनियाँ Gemini और Copilot को अपना आधार क्यों बनाती हैं

Resonance Alca Song की जानकारी का सारांश

एक व्यक्ति ही विश्व-स्तरीय कंपनी है: एजेंटिक इकोनॉमी का घोषणापत्र

टमाटर खाने का दुनिया का सबसे स्वादिष्ट तरीका

AI का उपयोग करके वन-पर्सन कंपनी कैसे बनाएं?

AI एजेंट लागू करने में आने वाली 7 ऑन-साइट और संगठनात्मक बाधाएं