Ejecuté el algoritmo de código abierto de X y encontré 7 variables que los creadores pueden controlar

@GoSailGlobal
CHINOhace 2 meses · 16 may 2026
542K
18
0
6
17

TL;DR

Un análisis de la actualización del algoritmo de X de mayo revela cómo las puntuaciones de calidad, el tiempo de permanencia y los círculos comunitarios afectan la distribución, proporcionando una hoja de ruta para los creadores.

He ejecutado el algoritmo de recomendación de X, publicado como código abierto en mayo, y descubrí que la parte de código abierto solo explica el 30 % de la clasificación real del Feed. El 70 % restante está oculto en configuraciones del lado del servidor, VM Ranker y reglas operativas.

Pero ese 30 % de código público es suficiente para responder una pregunta: ¿qué pueden controlar realmente los creadores?

Repositorio original: xai-org/x-algorithm (Actualizado el 15 de mayo, añadiendo 187 archivos y 18 263 líneas de código)

Este artículo no repetirá la visión general del algoritmo (las dos publicaciones de Punk2898 ya son muy completas), sino que se centrará en tres cosas:

1️⃣ Fenómenos contraintuitivos que observé al ejecutar el pipeline

2️⃣ Los mecanismos en la actualización de código de mayo que más impacto tienen en los creadores

3️⃣ Sugerencias operativas específicas basadas en estas observaciones

Observación 1: La clasificación del código abierto y el Feed real del Feed tienen una correlación casi nula

Jason Zhu - inline image

Utilicé el modelo Phoenix para ejecutar un corpus de 537 000 publicaciones deportivas. El rango de puntuación final dado por el modelo fue de 0.0000 a 0.0015, extremadamente plano. Las probabilidades predichas para Fav, Reply y RT fueron cercanas a cero; la clasificación se basó principalmente en Dwell (tiempo de permanencia) como señal para crear una brecha.

Luego raspé el Feed real «Para ti» para comparar. Usando tau de Kendall para calcular la correlación de rango, el resultado fue -0.10.

Este número significa: usar los pesos de demostración del código abierto (fav1.0 + reply0.5 + RT0.3 + dwell0.2) para predecir la clasificación real del Feed que ves es casi tan preciso como adivinar al azar.

En el Feed real, las publicaciones con cero interacciones aparecen entre las 7 primeras, mientras que las publicaciones con muchas interacciones se empujan a la 9.ª o 10.ª posición. Las publicaciones nuevas, creadas en los últimos 3 minutos y con cero interacciones, también pueden entrar en el Feed.

¿Qué significa esto?

Significa que el modelo Phoenix de código abierto solo es responsable de la «selección inicial de candidatos». Lo que realmente determina tu posición en el Feed de otra persona son las capas de reordenamiento posteriores. El código publicado en mayo completa precisamente la lógica de estas capas de reordenamiento.

Observación 2: Una puntuación de calidad de 0.4 es la línea invisible de vida o muerte

Jason Zhu - inline image

El módulo Grox añadido en mayo es la parte más crítica de esta actualización. No reemplaza a Phoenix; es el proveedor upstream de Phoenix. Después de enviar cada nueva publicación, Grox utiliza un modelo grande VLM para hacer 5 cosas:

  • Asignar una puntuación de calidad (quality_score, de 0 a 1)
  • Generar 7 etiquetas booleanas (contenido adulto, violencia, discursos de odio, etc.)
  • Asignar una puntuación de slop (slop_score, niveles 1-3)
  • Generar vectores de embedding multimodales
  • Realizar la revisión de seguridad PTOS

El código indica claramente: se requiere quality_score >= 0.4 para pasar la selección inicial. Cualquier valor por debajo de 0.4 se etiqueta como «baja calidad», y la difusión posterior se ve obstaculizada en todas partes.

Este umbral de 0.4 lo evalúa el modelo VLM, no la coincidencia de palabras clave. Puede entender el significado de tu texto, el contenido de tus imágenes y los fotogramas de video. Los sistemas de reglas que antes podían engañarse con «añadir imágenes y apilar palabras clave» ya no funcionan.

slop_score es otra arma nueva: el contenido con plantillas, la baja densidad de información y las publicaciones con rastros evidentes de IA generada recibirán puntuaciones altas. El nivel 1 es normal; los niveles 2-3 significan que el algoritmo cree que estás «diluyendo» el contenido.

Observación 3: Deslizar hacia arriba (swipe away) es una penalización activa, no solo «no verlo»

Jason Zhu - inline image

La versión de mayo mejoró las señales de comportamiento de 18 cabezas discretas a 19 cabezas discretas + 8 cabezas auxiliares continuas. Las nuevas cabezas continuas predicen métricas detalladas como «cuánto tiempo se quedó» y «tasa de finalización de lectura».

Pero la señal con mayor impacto en los creadores es: not_dwelled.

Antes pensábamos que «ninguna interacción del usuario» era neutral, equivalente a no ser visto. Incorrecto. Que un usuario pase rápidamente por tu publicación es una señal negativa activa, y el algoritmo te penalizará por ello.

Esto significa:

  • No captar la atención en el primer segundo de un video = penalización activa
  • Una primera frase aburrida en una publicación larga = penalización activa
  • Imágenes sin impacto visual = penalización activa

Al observar el Feed real, noté un fenómeno: algunas publicaciones con cero interacciones lograban estar entre las 7 primeras, mientras que algunas con muchas interacciones retrocedían. Una explicación razonable es: esas publicaciones con cero interacciones, aunque no tuvieron likes, sí generaron permanencia (señal de dwell), mientras que algunas publicaciones que parecen tener buenos datos en realidad tuvieron una gran cantidad de deslizamientos rápidos.

Observación 4: A quién sigues determina en qué círculo te coloca el algoritmo

Jason Zhu - inline image

El código de mayo añadió mutual_follow_jaccard_hydrator, que calcula la «similitud del círculo de seguidos mutuos entre tú y un autor».

Si tú y un autor siguen a muchas de las mismas personas (alto coeficiente de Jaccard), el algoritmo considera que estáis en el mismo «círculo de información» y es más propenso a mostrar su contenido.

Este mecanismo cambia una suposición fundamental: antes «la calidad del contenido determinaba la distribución»; ahora «la calidad del contenido + la pertenencia al círculo determinan conjuntamente la distribución».

Específicamente:

  • Cada cuenta que sigues está calculando tu identidad de círculo
  • Seguir al azar equivale a diluir tus etiquetas de círculo
  • Los seguidos mutuos con KOL del mismo campo son mucho más efectivos que seguir unilateralmente a 100 cuentas aleatorias
  • Los comentarios de alta calidad en publicaciones de grandes figuras (big V) entrarán en la cadena de señal following_replied_users, y tu avatar puede aparecer en el aviso «las personas que sigues también comentaron aquí»

Mi propio Feed «Para ti» confirma esto: más del 60 % del contenido recomendado proviene de creadores del círculo chino de IA porque mi lista de seguidos está concentrada en ese círculo.

Observación 5: La sección de comentarios ahora es una pista independiente

Jason Zhu - inline image

El código de mayo reveló un sistema de puntuación independiente para la sección de comentarios. Cada comentario recibe una puntuación de 0 a 3 por parte de Grok:

  • 3 puntos: Comentarios con incremento de información que pueden generar discusión
  • 2 puntos: Interacción normal
  • 1 punto: Corto pero no spam
  • 0 puntos: Activa la etiqueta de spam, afectando el crédito de la cuenta

Un comentario de 0 puntos no solo se colapsa; deja un registro en tu cuenta de que «una vez publicaste un comentario spam». La acumulación a largo plazo puede afectar el peso general de tu cuenta.

Al mismo tiempo, los comentarios spam debajo de tu publicación también afectan el peso de la publicación principal. Comentarios como «sigue por sigue», «primero» o «+1» — al algoritmo no solo le disgustan; reduce la distribución de tu publicación principal debido a ellos.

Por el contrario, el valor de exposición de un comentario de alta calidad puede ser mayor que el de publicar 10 publicaciones ordinarias tú mismo. Dejar un comentario respaldado por datos y que genere discusión debajo de la publicación de una gran figura equivale a tomar prestada la entrada de tráfico de esa gran figura.

Observación 6: Las estrategias de caché hacen que «cuándo publicar» sea más sutil que «qué publicar»

Jason Zhu - inline image

Hay un detalle en el código: cuando el número de publicaciones en el grupo de caché es >= 500, el sistema omite toda la lógica de extracción de publicaciones en tiempo real de Thunder/Phoenix/TweetMixer y devuelve directamente el contenido en caché.

Esto significa: para usuarios intensivos que abren X docenas de veces al día, muchas de sus solicitudes ni siquiera pasan por el algoritmo de recomendación; ven una lista antigua en la caché de Redis.

Una publicación que acabas de enviar podría ser completamente invisible para estos usuarios intensivos. Tu contenido solo tiene la oportunidad de entrar cuando la caché se refresque la próxima vez.

Esto también explica un fenómeno contraintuitivo: algunas cuentas publican docenas de veces al día y su tráfico no es malo. Esto se debe a que la publicación de alta frecuencia aumenta la probabilidad de «ser seleccionado en una determinada actualización de caché». Sin embargo, Punk2898 predice que esta estrategia se ajustará más adelante.

Para los creadores comunes, la sugerencia es: publicar 10-30 minutos antes del pico de actividad de tu público objetivo, para que tu publicación tenga más posibilidades de ser incluida cuando la caché se actualice.

Observación 7: MediumRisk es la reducción de peso oculta que no conoces

Jason Zhu - inline image

El código del sistema publicitario reveló por primera vez la variable brand_safety_verdict. Tiene cuatro niveles: Safe / LowRisk / MediumRisk / HighRisk.

Descubrimiento clave: el valor predeterminado es MediumRisk.

En otras palabras, si tu publicación no ha sido completamente revisada por Grox (o faltan etiquetas), el sistema te trata como «Riesgo Medio» por defecto. Las publicaciones de Riesgo Medio no se bloquean directamente, pero se evitan junto a los anuncios. Y las posiciones alrededor de los anuncios suelen ser áreas de alta exposición (zonas de enfoque visual del usuario).

El resultado: nunca recibes ningún aviso de infracción, pero tu exposición ya se está descontando. Esta es la «sombra oculta» más fácil de pasar por alto en el algoritmo v2.

¿Cómo evitarlo? Las publicaciones con temas claros y sin contenido «polémico» tienen más probabilidades de clasificarse rápidamente como Safe. Después de publicar una publicación importante, espera 30-60 minutos para que la revisión termine antes de hacer una promoción intensiva.

Lista de acciones para creadores

Jason Zhu - inline image

Basándonos en las 7 observaciones anteriores, aquí hay pasos concretos y accionables:

Sobre la calidad del contenido

Las primeras 10 palabras de cada publicación determinan dwell o not_dwelled. Debes crear una brecha cognitiva o un impacto de datos en la primera frase. Empezar con «Hoy aprendí un pequeño truco» provoca directamente un deslizamiento.

El contenido debe tener argumentos claros, densidad de información y sensación de estructura. El umbral de puntuación de calidad de 0.4 no es alto, pero las publicaciones de relleno con «plantilla + poca información + pocas palabras con una imagen» definitivamente no pasarán.

Evita la sensación de plantilla de IA: estructuras de oraciones uniformes, aperturas fijas («Primero... Segundo... Finalmente») y finales grandilocuentes serán detectados por slop_score.

Sobre operaciones de círculo

Audita tu lista de seguidos. Deja de seguir cuentas aleatorias que no estén en tu círculo objetivo. Cada seguido da forma a tu coeficiente de Jaccard.

Sigue mutuamente a 5-10 cuentas centrales de tu círculo objetivo. El peso del seguido mutuo es mucho mayor que el seguido unilateral.

En las publicaciones de las grandes figuras del círculo, deja comentarios con incremento de información. No «lo aprendí», sino complementa un dato, comparte un contraejemplo o formula una pregunta de extensión.

Sobre la gestión de la sección de comentarios

Limpia regularmente los comentarios spam debajo de tus publicaciones. Los anuncios y las respuestas sin sentido reducen el peso de la publicación principal.

No te hagas presente con spam en publicaciones irrelevantes. Los comentarios de 0 puntos dejan un registro de spam en tu cuenta.

**Sobre el momento de publicación

Publica 10-30 minutos antes del pico de actividad de tu público objetivo. Deja una ventana para que la actualización de caché te incluya.

Espera 30-60 minutos después de una publicación importante antes de promocionarla. Deja que la revisión de Grox termine para que pase de MediumRisk por defecto a Safe.

Sobre retuits con cita (quote retweets)

Ten cuidado al citar contenido controvertido. El mecanismo de responsabilidad conjunta VF v2 hará que la reducción de peso de las publicaciones penalizadas se extienda a ti a lo largo de la cadena de citas.

Utiliza capturas de pantalla + tus propios comentarios para contenido polémico en lugar de citas directas.

Sobre hashtags

Identifica 1-2 temas centrales de Grok y crea contenido de manera consistente en torno a ellos. Los streams de descubrimiento de nuevos usuarios están estrictamente filtrados por tema; si no estás en su conjunto de temas, para ellos no existes.

Utiliza ocasionalmente etiquetas # explícitas para reforzar la clasificación temática del algoritmo.

Sobre video

El primer segundo de un video es la línea de vida o muerte. La señal de not_dwelled es más evidente en los videos.

El contenido importante debe tener una versión solo de texto. Algunos usuarios tienen filtros de «ver menos videos» activados, y las publicaciones con duración de video serán eliminadas por completo.

Enlaces de referencia:

https://github.com/xai-org/x-algorithm

https://x.com/punk2898/status/2013538743467286981

https://x.com/punk2898/status/2055439323693289598

Save to YouMind

Use YouMind to read viral articles deeply

Save the source, ask focused questions, summarize the argument, and turn a viral article into reusable notes in one AI workspace.

Explore YouMind

Más patrones por descifrar

Artículos virales recientes

Explorar más artículos virales