Executei o algoritmo de código aberto do X e encontrei 7 variáveis que os criadores podem controlar

@GoSailGlobal
CHINÊShá 2 meses · 16/05/2026
542K
18
0
6
17

TL;DR

Uma análise da atualização do algoritmo do X de maio revela como as pontuações de qualidade, o tempo de permanência e os círculos da comunidade impactam a distribuição, fornecendo um roteiro para criadores.

Executei o algoritmo de recomendação do X, que foi aberto em maio, e descobri que a parte open-source explica apenas 30% da classificação real do Feed. Os 70% restantes estão ocultos em configurações do lado do servidor, no VM Ranker e em regras operacionais.

Mas esses 30% de código público são suficientes para responder a uma pergunta: o que os criadores podem realmente controlar?

Repositório original: xai-org/x-algorithm (Atualizado em 15 de maio, adicionando 187 arquivos e 18.263 linhas de código)

Este artigo não repetirá a visão geral do algoritmo (os dois posts do Punk2898 já estão muito completos), mas focará em três coisas:

1️⃣ Fenômenos contra-intuitivos que observei ao executar o pipeline

2️⃣ Os mecanismos na atualização de código de maio que têm o maior impacto sobre os criadores

3️⃣ Sugestões operacionais específicas baseadas nessas observações

Observação 1: Classificação open-source e o Feed real têm correlação quase zero

Jason Zhu - inline image

Usei o modelo Phoenix para processar um corpus de 537.000 posts esportivos. A faixa final de pontuação dada pelo modelo foi de 0,0000 a 0,0015, extremamente plana. As probabilidades previstas para Fav, Reply e RT estavam todas próximas de zero; a classificação dependia principalmente de Dwell (tempo de permanência) como sinal para criar uma diferença.

Em seguida, raspei o Feed "Para Você" real para comparação. Usando o tau de Kendall para calcular a correlação de classificação, o resultado foi -0,10.

Este número significa: usar os pesos de demonstração no código open-source (fav1,0 + reply0,5 + RT0,3 + dwell0,2) para prever a classificação real do Feed que você vê é tão preciso quanto chutar aleatoriamente.

No Feed real, posts com zero interação aparecem entre os 7 primeiros, enquanto posts com alta interação são empurrados para a 9ª ou 10ª posição. Posts novos publicados em menos de 3 minutos com zero interação também podem entrar no Feed.

O que isso significa?

Significa que o modelo Phoenix open-source é responsável apenas pela "triagem inicial de candidatos". O que realmente determina sua posição no Feed de outra pessoa são as camadas de reclassificação subsequentes. O código aberto em maio, por acaso, completa a lógica dessas camadas de reclassificação.

Observação 2: Uma pontuação de qualidade de 0,4 é a linha invisível da vida e da morte

Jason Zhu - inline image

O módulo Grox adicionado em maio, Grox, é a parte mais crítica desta atualização. Ele não substitui o Phoenix; é o fornecedor upstream do Phoenix. Após o envio de cada novo post, o Grox usa um modelo VLM grande para fazer 5 coisas:

  • Atribuir uma pontuação de qualidade (quality_score, 0 a 1)
  • Gerar 7 tags booleanas (conteúdo adulto, violência, discurso de ódio, etc.)
  • Atribuir uma pontuação de "slop" (slop_score, níveis 1-3)
  • Gerar vetores de embedding multimodais
  • Realizar a revisão de segurança PTOS

O código afirma claramente: quality_score >= 0,4 é necessário para passar na triagem inicial. Qualquer coisa abaixo de 0,4 é rotulada como "baixa qualidade", e a difusão subsequente é prejudicada em todos os lugares.

Este limite de 0,4 é julgado pelo modelo VLM, não por correspondência de palavras-chave. Ele pode entender o significado do seu texto, o conteúdo das suas imagens e os quadros de vídeo. Sistemas de regras que antes podiam ser enganados por "adicionar imagens e empilhar palavras-chave" não funcionam mais.

slop_score é outra nova arma: conteúdo modelado, baixa densidade de informação e posts com traços óbvios de geração de IA receberão pontuações altas. O Nível 1 é normal; os níveis 2-3 significam que o algoritmo acha que você está "enchendo linguiça".

Observação 3: Passar o dedo é uma penalidade ativa, não apenas "não ver"

Jason Zhu - inline image

A versão de maio atualizou os sinais comportamentais de 18 heads discretos para 19 heads discretos + 8 heads auxiliares contínuos. Os novos heads contínuos preveem métricas refinadas como "quanto tempo permaneceu" e "taxa de conclusão de leitura".

Mas o sinal com o maior impacto sobre os criadores é: not_dwelled.

Anteriormente, pensávamos que "nenhuma interação do usuário" era neutro, equivalente a não ser visto. Errado. Um usuário passando rapidamente pelo seu post é um sinal negativo ativo, e o algoritmo vai te penalizar por isso.

Isso significa:

  • Não conseguir prender a atenção no primeiro 1 segundo de um vídeo = penalidade ativa
  • Uma primeira frase desinteressante em um post longo = penalidade ativa
  • Imagens sem impacto visual = penalidade ativa

Ao observar o Feed real, notei um fenômeno: alguns posts com zero interação conseguiam entrar no Top 7, enquanto alguns posts com alta interação eram empurrados para trás. Uma explicação razoável é: aqueles posts com zero interação, embora não tenham recebido curtidas, na verdade tiveram usuários que permaneceram (gerando um sinal de dwell), enquanto alguns posts que parecem ter bons dados, na verdade, tiveram um grande número de passadas de dedo rápidas.

Observação 4: Quem você segue determina em qual círculo o algoritmo te coloca

Jason Zhu - inline image

O código de maio adicionou mutual_follow_jaccard_hydratior, que calcula a "similaridade do círculo de seguidores mútuos entre você e um certo autor".

Se você e um autor seguem muitas das mesmas pessoas (alto coeficiente de Jaccard), o algoritmo considera que vocês estão no mesmo "círculo de informação" e tende mais a empurrar o conteúdo dele para você.

Esse mecanismo muda uma suposição fundamental: antes era "a qualidade do conteúdo determina a distribuição"; agora é "qualidade do conteúdo + pertencimento ao círculo determinam conjuntamente a distribuição".

Especificamente:

  • Cada conta que você segue está calculando sua identidade de círculo
  • Seguir aleatoriamente é equivalente a diluir suas tags de círculo
  • Seguidores mútuos com KOLs no mesmo campo são muito mais eficazes do que seguir unilateralmente 100 contas aleatórias
  • Comentários de alta qualidade em posts de grandes influenciadores entrarão na cadeia de sinais following_replied_users, e seu avatar pode aparecer no prompt "pessoas que você segue também comentaram aqui"

Meu próprio Feed "Para Você" confirma isso: mais de 60% do conteúdo recomendado recomendado vem de criadores no círculo chinês de IA porque minha lista de seguidos está concentrada nesse círculo.

Observação 5: A seção de comentários é agora uma trilha independente

Jason Zhu - inline image

O código de maio revelou um sistema de pontuação independente para a seção de comentários. Cada comentário é pontuado de 0 a 3 pelo Grok:

  • 3 pontos: Comentários com incremento de informação que podem gerar discussão
  • 2 pontos: Interação normal
  • 1 ponto: Curto, mas não spam
  • 0 pontos: Aciona a tag de spam, afetando o crédito da conta

Um comentário de 0 ponto não é apenas recolhido; ele deixa um registro na sua conta de que você "uma vez postou um comentário spam". O acúmulo de longo prazo pode afetar o peso geral da sua conta.

Ao mesmo tempo, comentários spam no seu post também afetam o peso do post principal. Comentários como "segue que sigo", "primeiro" ou "+1" — o algoritmo não apenas não gosta deles; ele diminui a distribuição do seu post principal por causa deles.

Por outro lado, o valor de exposição de um comentário de alta qualidade pode ser maior do que postar 10 posts comuns você mesmo. Deixar um comentário com dados e que gere discussão no post de um grande influenciador é equivalente a pegar carona na entrada de tráfego do grande influenciador.

Observação 6: Estratégias de cache tornam "quando postar" mais sutil do que "o que postar"

Jason Zhu - inline image

Há um detalhe no código: quando o número de posts no pool de cache é >= 500, o sistema pula toda a lógica de puxar posts em tempo real do Thunder/Phoenix/TweetMixer e retorna diretamente o conteúdo em cache.

Isso significa: para usuários pesados que abrem o X dezenas de vezes ao dia, muitas de suas requisições não passam pelo algoritmo de recomendação; elas veem uma lista antiga no cache do Redis.

Um post que você acabou de enviar pode ser completamente invisível para esses usuários pesados. Seu conteúdo só tem chance de entrar só aparece quando o cache for atualizado na próxima vez.

Isso também explica um fenômeno contra-intuitivo: algumas contas postam dezenas de vezes ao dia e o tráfego não é ruim. Isso ocorre porque a postagem de alta frequência aumenta a probabilidade de "ser selecionado em uma determinada atualização de cache". No entanto, Punk2898 prevê que essa estratégia será ajustada posteriormente.

Para criadores comuns, a sugestão é: poste de 10 a 30 minutos antes do pico de atividade do seu público-alvo, para que seu post tenha uma chance melhor de ser incluído quando o cache for atualizado.

Observação 7: MediumRisk é a redução de peso oculta que você não conhece

Jason Zhu - inline image

O código do sistema de publicidade revelou pela primeira vez a variável brand_safety_verdict. Ela tem quatro níveis: Safe / LowRisk / MediumRisk / HighRisk.

Descoberta chave: O valor padrão é MediumRisk.

Em outras palavras, se o seu post não foi totalmente revisado pelo Grox (ou as tags estão faltando), o sistema trata você como "Médio Risco" por padrão. Posts de Médio Risco não são bloqueados diretamente, mas são evitados perto de anúncios. E as posições ao redor de anúncios são frequentemente áreas de alta exposição (áreas de foco visual do usuário).

O resultado é: você nunca recebe nenhum aviso de violação, mas sua exposição já está sendo descontada. Este é o "shadowban oculto" mais facilmente negligenciado no algoritmo v2.

Como evitar? Posts com temas claros e sem conteúdo "polêmico" têm mais chances de serem rapidamente classificados como Safe. Após postar um post importante, espere de 30 a 60 minutos para a revisão terminar antes de fazer uma promoção pesada.

Lista de Ações para o Criador

Jason Zhu - inline image

Com base nas 7 observações acima, aqui estão etapas acionáveis específicas:

Sobre Qualidade do Conteúdo

As primeiras 10 palavras de cada post determinam se o usuário permanece ou passa o dedo. Você deve criar uma lacuna cognitiva ou impacto de dados na primeira frase. Começar com "Aprendi um pequeno truque hoje" desencadeia diretamente um deslize para sair.

O conteúdo deve ter argumentos claros, densidade de informação e sensação de estrutura. O limite de pontuação de qualidade de 0,4 não é alto, mas posts de preenchimento "modelo + baixa info + poucas palavras com imagem" definitivamente não passarão.

Evite a sensação de modelo de IA: estruturas de frase uniformes, aberturas fixas ("Primeiro... Segundo... Finalmente") e finais grandiosos serão detectados pelo slop_score.

Sobre Operações de Círculo

Audite sua lista de seguidos. Deixe de seguir contas aleatórias que não estão no seu círculo alvo. Cada seguido molda seu coeficiente de Jaccard.

Siga mutuamente de 5 a 10 contas principais no seu círculo alvo. O peso do seguimento mútuo é muito maior do que o seguimento unilateral.

Nos posts de grandes influenciadores do círculo, deixe comentários com incremento de informação. Não "aprendi", mas complemente com um dado, compartilhe um contra-exemplo ou faça uma pergunta de extensão.

Sobre Gerenciamento da Seção de Comentários

Limpe regularemente os comentários spam nos seus posts. Anúncios e respostas sem sentido diminuirão o peso do post principal.

Não encha de spam sua presença em posts irrelevantes. Comentários de 0 pontos deixam um registro de spam na sua conta.

Sobre o Momento da Postagem

Poste de 10 a 30 minutos antes do pico de atividade do seu público-alvo. Deixe uma janela para a atualização do cache te incluir.

Espere de 30 a 60 minutos após um post importante antes de promovê-lo. Deixe a revisão do Grox terminar para atualizar do MediumRisk padrão para Safe.

Sobre Retweets com Citação

Tenha cuidado ao citar conteúdo polêmico. O mecanismo de responsabilidade conjunta VF do v2 fará com que a redução de peso de posts penalizados se espalhe para você ao longo da cadeia de citações.

Use capturas de tela + seus próprios comentários para conteúdo controverso em vez de citações diretas.

Sobre Hashtags

Identifique 1-2 tópicos principais do Grok e crie consistentemente em torno deles. Os streams de descoberta de novos usuários são estritamente filtrados por tópico; se você não estiver no conjunto de tópicos deles, você não existe para eles.

Ocasionalmente, use tags # explícitas para fortalecer a classificação do tópico pelo algoritmo.

Sobre Vídeo

O primeiro 1 segundo de um vídeo é a linha da vida e da morte. O sinal not_dwelled é mais óbvio em vídeos.

Conteúdo importante deve ter uma versão apenas de texto. Alguns usuários têm filtros "ver menos vídeos" ativados, e posts com campos de duração de vídeo serão cortados completamente.

Links de referência:

https://github.com/xai-org/x-algorithm

https://x.com/punk2898/status/2013538743467286981

https://x.com/punk2898/status/2055439323693289598

Save to YouMind

Use YouMind to read viral articles deeply

Save the source, ask focused questions, summarize the argument, and turn a viral article into reusable notes in one AI workspace.

Explore YouMind

Mais padrões para decifrar

Artigos virais recentes

Explorar mais artigos virais