Ho analizzato l'algoritmo open-source di X e ho scoperto 7 variabili che i creator possono controllare

@GoSailGlobal
CINESE2 mesi fa · 16 mag 2026
542K
18
0
6
17

TL;DR

Un'analisi dell'aggiornamento dell'algoritmo di X di maggio rivela come i punteggi di qualità, il tempo di permanenza e le community circle influenzino la distribuzione, offrendo una guida strategica per i creator.

Ho eseguito l'algoritmo di raccomandazione di X open-sourced a maggio e ho scoperto che la parte open-source spiega solo il 30% dell'effettivo ranking del Feed. Il restante 70% è nascosto nelle configurazioni lato server, nel VM Ranker e nelle regole operative.

Ma questo 30% di codice pubblico è sufficiente per rispondere a una domanda: cosa possono effettivamente controllare i creator?

Repository originale: xai-org/x-algorithm (Aggiornato il 15 maggio, aggiungendo 187 file e 18.263 righe di codice)

Questo articolo non ripeterà la panoramica dell'algoritmo (i due post di Punk2898 sono già molto completi) ma si concentra su tre cose:

1️⃣ Fenomeni controintuitivi osservati durante l'esecuzione della pipeline

2️⃣ I meccanismi nell'aggiornamento del codice di maggio che hanno il maggiore impatto sui creator

3️⃣ Suggerimenti operativi specifici basati su queste osservazioni

Osservazione 1: Il ranking open-source e il Feed reale hanno correlazione quasi nulla

Jason Zhu - inline image

Ho usato il modello Phoenix per elaborare un corpus di 537.000 post sportivi. Il range finale dei punteggi fornito dal modello era da 0,0000 a 0,0015, estremamente piatto. Le probabilità previste per Fav, Reply e RT erano tutte vicine a zero; il ranking si basava principalmente su Dwell (tempo di permanenza) come segnale per creare un divario.

Poi ho scaricato il Feed reale "Per Te" per confrontarlo. Usando il tau di Kendall per calcolare la correlazione di ranking, il risultato è stato -0,10.

Questo numero significa: usare i pesi demo weights nel codice open-source (fav1.0 + reply0.5 + RT0.3 + dwell0.2) per prevedere il ranking effettivo del Feed che vedi è tanto accurato quanto indovinare a caso.

Nel Feed reale, post con zero interazioni appaiono tra i primi 7, mentre post con molte interazioni vengono spinti al 9° o 10° posto. Post nuovi pubblicati entro 3 minuti con zero interazioni possono comunque entrare nel Feed.

Cosa significa?

Significa che il modello open-source Phoenix è responsabile solo dello "screening iniziale dei candidati". Ciò che determina realmente il tuo posizionamento nel Feed di qualcun altro sono i successivi strati di ri-ranking. Il codice open-sourced a maggio completa proprio la logica di questi strati di ri-ranking.

Osservazione 2: Un punteggio di qualità di 0,4 è la linea invisibile tra vita e morte

Jason Zhu - inline image

Il modulo Grox aggiunto a maggio è la parte più critica di questo aggiornamento. Non sostituisce Phoenix; è il suo fornitore a monte. Dopo l'invio di ogni nuovo post, Grox usa un modello VLM per fare 5 cose:

  • Assegnare un punteggio di qualità (quality_score, da 0 a 1)
  • Generare 7 tag booleani (contenuti per adulti, violenza, incitamento all'odio, ecc.)
  • Assegnare un punteggio slop (slop_score, livelli 1-3)
  • Generare vettori di embedding multimodali
  • Eseguire la revisione di sicurezza PTOS

Il codice afferma chiaramente: quality_score >= 0,4 è necessario per superare lo screening iniziale. Qualsiasi valore inferiore a 0,4 viene etichettato come "bassa qualità", e la successiva diffusione è ostacolata ovunque.

Questa soglia di 0,4 è giudicata dal modello VLM, non da corrispondenza di parole chiave. Può comprendere il significato del tuo testo, il contenuto delle tue immagini e i fotogrammi video. I sistemi di regole che prima potevano essere ingannati con "aggiungere immagini e accumulare parole chiave" non funzionano più.

slop_score è un'altra nuova arma: contenuti template, bassa densità informativa e post con evidenti tracce di AI generativa riceveranno punteggi alti. Livello 1 è normale; livelli 2-3 significano che l'algoritmo pensa che tu stia "diluendo" i contenuti.

Osservazione 3: Scorrere via è una penalità attiva, non solo "non vedere"

Jason Zhu - inline image

La versione di maggio ha aggiornato i segnali comportamentali da 18 teste discrete a 19 teste discrete + 8 teste ausiliarie continue. Le nuove teste continue prevedono metriche dettagliate come "per quanto tempo è rimasto" e "tasso di completamento della lettura".

Ma il segnale con il maggiore impatto sui creator è: not_dwelled.

In precedenza, pensavamo che "nessuna interazione utente" fosse neutrale, equivalente a non essere visti. Sbagliato. Un utente che scorre rapidamente oltre il tuo post è un segnale negativo attivo, e l'algoritmo ti penalizzerà per questo.

Questo significa:

  • Non catturare l'attenzione nel primo 1 secondo di un video = penalità attiva
  • Una prima frase poco interessante in un post lungo = penalità attiva
  • Immagini senza impatto visivo = penalità attiva

Durante l'osservazione del Feed reale, ho notato un fenomeno: alcuni post con zero interazioni potevano entrare tra i primi 7, mentre alcuni post con molte interazioni venivano retrocessi. Una spiegazione ragionevole è: quei post con zero interazioni, anche se non ricevevano like, venivano effettivamente trattenuti dagli utenti (generando un segnale dwell), mentre alcuni post che sembrano avere buoni dati in realtà avevano un gran numero di scorrimenti rapidi.

Osservazione 4: Chi segui determina in quale cerchio l'algoritmo ti inserisce

Jason Zhu - inline image

Il codice di maggio ha aggiunto mutual_follow_jaccard_hydrator, che calcola la "somiglianza del cerchio di seguiti reciproci tra te e un certo autore".

Se tu e un autore seguite molte delle stesse persone (alto coefficiente di Jaccard), l'algoritmo considera che appartenete allo stesso "cerchio informativo" ed è più propenso a spingerti i loro contenuti.

Questo meccanismo cambia un presupposto fondamentale: prima si diceva "la qualità dei contenuti determina la distribuzione"; ora è "la qualità dei contenuti + l'appartenenza al cerchio determinano congiuntamente la distribuzione."

Nello specifico:

  • Ogni account che segui calcola la tua identità di cerchio
  • Seguire a caso equivale a diluire i tuoi tag di cerchio
  • I seguiti reciproci con KOL nello stesso campo sono molto più efficaci del follow unidirezionale di 100 account casuali
  • I commenti di alta qualità sotto i post di grandi V entreranno nella catena di segnali following_replied_users, e il tuo avatar potrebbe apparire nel prompt "persone che segui hanno commentato anche qui"

Il mio Feed "Per Te" lo conferma: oltre il 60% dei contenuti consigliati proviene da creator nel cerchio AI cinese, perché la mia lista di seguiti è concentrata in quel cerchio.

Osservazione 5: La sezione commenti è ora un binario indipendente

Jason Zhu - inline image

Il codice di maggio ha rivelato un sistema di punteggio indipendente per la sezione commenti. Ogni commento viene valutato 0-3 da Grok:

  • 3 punti: Commenti con incremento informativo che possono innescare discussioni
  • 2 punti: Interazione normale
  • 1 punto: Breve ma non spam
  • 0 punti: Attiva il tag spam, influenzando il credito dell'account

Un commento da 0 punti non viene solo nascosto; lascia una registrazione sul tuo account di "aver pubblicato un commento spam". L'accumulo a lungo termine può influenzare il peso complessivo dell'account.

Allo stesso tempo, i commenti spam sotto il tuo post influenzano anche il peso del post principale. Commenti come "segui per seguire", "primo" o "+1" — l'algoritmo non li disapprova semplicemente; abbassa la distribuzione del tuo post principale a causa loro.

Al contrario, il valore di esposizione di un commento di alta qualità potrebbe essere superiore a pubblicare 10 post ordinari da soli. Lasciare un commento basato su dati e che inneschi una discussione sotto il post di un grande V equivale a prendere in prestito l'ingresso di traffico del grande V.

Osservazione 6: Le strategie di caching rendono "quando pubblicare" più sottile di "cosa pubblicare"

Jason Zhu - inline image

C'è un dettaglio nel codice: quando il numero di post nel pool di cache è >= 500, il sistema salta tutta la logica di recupero dei post in tempo reale da Thunder/Phoenix/TweetMixer e restituisce direttamente contenuto cache.

Questo significa: per gli utenti pesanti che aprono X decine di volte al giorno, molte delle loro richieste non passano affatto attraverso l'algoritmo di raccomandazione; vedono un vecchio elenco nella cache Redis.

Un post che hai appena inviato potrebbe essere completamente invisibile a questi utenti pesanti. Il tuo contenuto ha possibilità di entrare solo quando la cache si aggiorna la prossima volta.

Questo spiega anche un fenomeno controintuitivo: alcuni account pubblicano decine di post al giorno e il loro traffico non è male. Questo perché la pubblicazione ad alta frequenza di pubblicazione aumenta la probabilità di "essere selezionati in un determinato refresh della cache". Tuttavia,8 prevede che questa strategia verrà successivamente modificata.

Per i creator ordinari, il suggerimento è: pubblicare 10-30 minuti prima dell'ora di picco dell'attività del tuo pubblico target, così il tuo post ha più possibilità di essere incluso quando la cache si aggiorna.

Osservazione 7: MediumRisk è la riduzione di peso nascosta che non conosci

Jason Zhu - inline image

Il codice del sistema pubblicitario ha rivelato per la prima volta la variabile brand_safety_verdict. Ha quattro livelli: Safe / LowRisk / MediumRisk / HighRisk.

Scoperta chiave: Il valore predefinito è MediumRisk.

In altre parole, se il tuo post non è stato completamente revisionato da Grox (o i tag sono mancanti), il sistema ti considera "Rischio Medio" per impostazione predefinita. I post a Rischio Medio non vengono bloccati direttamente, ma vengono evitati nelle vicinanze degli annunci pubblicitari. E le posizioni intorno agli annunci sono spesso aree ad alta esposizione (aree di attenzione visiva degli utenti).

Il risultato è: non ricevi mai alcuna notifica di violazione, ma la tua esposizione è già scontata. Questo è il "shadowban nascosto" più facilmente trascurato nell'algoritmo v2.

Come evitarlo? I post con temi chiari e senza contenuti "borderline" hanno più probabilità di essere classificati rapidamente come Safe. Dopo aver pubblicato un post importante, attendi 30-60 minuti per far completare la revisione prima di fare promozione pesante.

Checklist per le azioni del creator

Jason Zhu - inline image

Basato sulle 7 osservazioni sopra, ecco passaggi attuabili specifici:

Riguardo la qualità dei contenuti

Le prime 10 parole di ogni post determinano dwell o not_dwelled. Devi creare un gap cognitivo o un impatto dati nella prima frase. Iniziare con "Oggi ho imparato un piccolo trucco" innesca direttamente uno scorrimento via.

I contenuti dovrebbero avere argomenti chiari, densità informativa e senso di struttura. La soglia del punteggio di qualità 0,4 non è alta, ma i post riempitivi "template + poche info + poche parole con un'immagine" sicuramente non passeranno.

Evita la sensazione di template AI: strutture di frasi uniformi, aperture fisse ("Prima... Secondo... Infine") e finali grandiosi verranno rilevati da slop_score.

Riguardo le operazioni di cerchio

Controlla la tua lista di seguiti. Smetti di seguire account casuali non nel tuo cerchio target. Ogni follow modella il tuo coefficiente Jaccard.

Segui reciprocamente 5-10 account principali nel tuo cerchio target. Il peso del follow reciproco è molto più alto dei follow unidirezionali.

Nei post dei grandi V del cerchio, lascia commenti con incremento informativo. Non "ho imparato", ma aggiungi un dato, condividi un controesempio o fai una domanda di approfondimento.

Riguardo la gestione della sezione commenti

Pulisci regolarmente i commenti spam sotto i tuoi post. Pubblicità e risposte senza senso abbasseranno il peso del post principale.

Non spammare la tua presenza sotto post irrilevanti. I commenti da 0 punti lasciano una registrazione spam sul tuo account.

Riguardo i tempi di pubblicazione

Pubblica 10-30 minuti prima del picco di attività del tuo pubblico target. Lascia una finestra per far sì che il refresh della cache ti includa.

Attendi 30-60 minuti dopo un post importante prima di promuoverlo. Lascia che la revisione di Grox finisca per passare dal default MediumRisk a Safe.

Riguardo i citati

Fai attenzione nel citare contenuti borderline. Il meccanismo di responsabilità congiunta VF v2 farà sì che la riduzione di peso dei post penalizzati si diffonda a te lungo la catena di citazioni.

Usa screenshot + i tuoi commenti per contenuti controversi invece di citazioni dirette.

Riguardo gli hashtag

Identifica 1-2 topic Grok principali e crea intorno a loro in modo coerente. I feed di scoperta dei nuovi utenti sono rigorosamente filtrati per topic; se non sei nel loro set di topic, per loro non esisti.

Usa occasionalmente tag # espliciti per rafforzare la classificazione dei topic da parte dell'algoritmo.

Riguardo i video

Il primo 1 secondo di un video è la linea tra vita e morte. Il segnale not_dwelled è più evidente nei video.

I contenuti importanti devono avere una versione solo testo. Alcuni utenti hanno filtri "vedere meno video" attivati, e i post con campi di durata video verranno tagliati del tutto.

Link di riferimento:

https://github.com/xai-org/x-algorithm

https://x.com/punk2898/status/2013538743467286981

https://x.com/punk2898/status/2055439323693289598

Save to YouMind

Use YouMind to read viral articles deeply

Save the source, ask focused questions, summarize the argument, and turn a viral article into reusable notes in one AI workspace.

Explore YouMind

Altri pattern da decodificare

Articoli virali recenti

Esplora altri articoli virali