Ejecuté el algoritmo de código abierto de X y encontré 7 variables que los creadores pueden controlar

@GoSailGlobal
CHINOhace 2 meses · 16 may 2026
542K
18
0
6
17

TL;DR

Un análisis de la actualización del algoritmo de X de mayo revela cómo las puntuaciones de calidad, el tiempo de permanencia y los círculos comunitarios impactan la distribución, proporcionando una hoja de ruta para los creadores.

He ejecutado el algoritmo de recomendación de X, de código abierto lanzado en mayo, y descubrí que la parte de código abierto solo explica el 30% de la clasificación real del Feed. El 70% restante está oculto en configuraciones del lado del servidor, VM Ranker y reglas operativas.

Pero este 30% de código público es suficiente para responder una pregunta: ¿qué pueden controlar realmente los creadores?

Repositorio original: xai-org/x-algorithm (Actualizado el 15 de mayo, agregando 187 archivos y 18,263 líneas de código)

Este artículo no repetirá la visión general del algoritmo (las dos publicaciones de Punk2898 ya están muy completas), sino que se centrará en tres cosas:

1️⃣ Fenómenos contraintuitivos que observé al ejecutar el pipeline

2️⃣ Los mecanismos en la actualización de código de mayo que tienen el mayor impacto en los creadores

3️⃣ Sugerencias operativas específicas basadas en estas observaciones

Observación 1: La clasificación de código abierto y el Feed real tienen una correlación casi nula

Jason Zhu - inline image

Usé el modelo Phoenix para ejecutar un corpus de 537,000 publicaciones deportivas. El rango de puntuación final que dio el modelo fue de 0.0000 a 0.0015, extremadamente plano. Las probabilidades predichas para Fav, Reply y RT fueron cercanas a cero; la clasificación se basó principalmente en Dwell (tiempo de permanencia) como señal para crear una brecha.

Luego, raspé el feed "Para ti" real para comparar. Usando tau de Kendall para calcular la correlación de rango, el resultado fue -0.10.

Este número significa: usar los pesos de demostración en el código abierto (fav1.0 + reply0.5 + RT0.3 + dwell0.2) para predecir la clasificación real del Feed que ves es tan preciso como adivinar al azar.

En el.

En el Feed real, las publicaciones con cero interacciones aparecen entre los primeros 7, mientras que las publicaciones con alta interacción se empujan a la 9.ª o 10.ª posición. Las publicaciones nuevas publicadas en los últimos 3 minutos con cero interacciones también pueden entrar en el Feed.

¿Qué significa esto?

Significa que el modelo Phoenix de código abierto solo es responsable de la "selección inicial de candidatos". Lo que realmente determina tu posición en el Feed de otra persona son los posteriores niveles de reclasificación. El código abierto en mayo completa la lógica de estos niveles de reclasificación.

Observación 2: Una puntuación de calidad de 0.4 es la línea invisible de vida o muerte

Jason Zhu - inline image

El módulo Grox agregado en mayo es la parte más crítica de esta actualización. No reemplaza a Phoenix; es el proveedor upstream de Phoenix. Después de que se envía cada nueva publicación, Grox usa un modelo grande VLM para hacer 5 cosas:

  • Asignar una puntuación de calidad (quality_score, 0 a 1)
  • Generar 7 etiquetas booleanas (contenido para adultos, violencia, discurso de odio, etc.)
  • Asignar una puntuación de slop (slop_score, niveles 1-3)
  • Generar vectores de incrustación multimodales
  • Realizar la revisión de seguridad PTOS

El código establece claramente: se requiere quality_score >= 0.4 para pasar la selección inicial. Todo lo que está por debajo de 0.4 se etiqueta como "baja calidad" y la difusión posterior se ve obstaculizada en todas partes.

Este umbral de 0.4 es juzgado por el modelo VLM, no por coincidencia de palabras clave. Puede entender el significado de tu texto, el contenido de tus imágenes y los fotogramas de video. Los sistemas de reglas que antes se podían engañar con "agregar imágenes y apilar palabras clave" ya no funcionan.

slop_score es otra nueva arma: el contenido basado en plantillas, la baja densidad de información y las publicaciones con rastros evidentes de IA generada recibirán puntuaciones altas. El nivel 1 es normal; los niveles 2-3 significan que el algoritmo cree que estás "diluyendo" el contenido.

Observación 3: Deslizar hacia arriba es una penalización activa, no solo "no verlo"

Jason Zhu - inline image

La versión de mayo actualizó las señales de comportamiento de 18 cabezales discretos a 19 cabezales discretos + 8 cabezales auxiliares continuos. Los nuevos cabezales continuos predicen métricas detalladas como "cuánto tiempo se quedó" y "tasa de finalización de lectura".

Pero la señal con mayor impacto para los creadores es: not_dwelled.

Anteriormente, pensábamos que "ninguna interacción del usuario" era neutral, equivalente a no ser visto. Incorrecto. Que un usuario pase rápidamente tu publicación es una señal activa, y el algoritmo te penalizará por ello.

Esto significa:

  • No captar la atención en el primer segundo de un video = penalización activa
  • Una primera oración poco interesante en una publicación larga = penalización activa
  • Imágenes sin impacto visual = penalización activa

Mientras observaba el Feed real, noté un fenómeno: algunas publicaciones con cero interacciones podían entrar en los 7 primeros, mientras que algunas publicaciones con alta interacción se retrasaban. Una explicación razonable es: esas publicaciones con cero interacciones, aunque no fueran "me gusta", en realidad tenían usuarios que se quedaban en ellas (generando una señal de permanencia), mientras que algunas publicaciones que parecen tener buenos datos en realidad tenían un gran número de deslizamientos rápidos.

Observación 4: A quién sigues determina en qué círculo te coloca el algoritmo

Jason Zhu - inline image

El código de mayo agregó mutual_follow_jaccard_hydrator, que calcula la "similitud del círculo de seguimiento mutuo entre tú y un autor determinado".

Si tú y un autor siguen a muchas de las mismas personas (alto coeficiente de Jaccard), el algoritmo considera que están en el mismo "círculo de información" y está más inclinado a mostrar su contenido.

Este mecanismo cambia una suposición fundamental: antes era "la calidad del contenido determina la distribución"; ahora es "la calidad del contenido + la pertenencia al círculo determinan conjuntamente la distribución".

Específicamente:

  • Cada cuenta que sigues está calculando la identidad de tu círculo
  • Seguir al azar equivale a diluir las etiquetas de tu círculo
  • Los seguimientos mutuos con KOLs en el mismo campo son mucho más efectivos que seguir unilateralmente a 100 cuentas al azar
  • Los comentarios de alta calidad en publicaciones de grandes cuentas entrarán en la cadena de señales following_replied_users, y tu avatar podría aparecer en el aviso "las personas que sigues también comentaron aquí"

Mi propio feed "Para ti" lo confirma: más del 60% del contenido recomendado proviene de creadores en el círculo chino de IA porque mi lista de seguidos se concentra en ese círculo.

Observación 5: La sección de comentarios es ahora una pista independiente

Jason Zhu - inline image

El código de mayo reveló un sistema de puntuación independiente para la sección de comentarios. Cada comentario recibe una puntuación de 0 a 3 por parte de Grok:

  • 3 puntos: Comentarios con incremento de información que pueden generar discusión
  • 2 puntos: Interacción normal
  • 1 punto: Corto pero no spam
  • 0 puntos: Activa la etiqueta de spam, afectando el crédito de la cuenta

Un comentario de 0 puntos no solo se colapsa; deja un registro en tu cuenta de que "una vez publicaste un comentario spam". La acumulación a largo plazo puede afectar el peso general de tu cuenta.

Al mismo tiempo, los comentarios spam debajo de tu publicación también afectan el peso de la publicación principal. Comentarios como "sígueme y te sigo", "primero" o "+1": el algoritmo no solo no le gustan, sino que reduce la distribución de tu publicación principal debido a ellos.

Por el contrario, el valor de exposición de un comentario de alta calidad podría ser mayor que publicar 10 publicaciones ordinarias tú mismo. Dejar un comentario respaldado por datos y que genere discusión debajo de la publicación de una gran cuenta equivale a tomar prestada la entrada de tráfico de esa gran cuenta.

Observación 6: Las estrategias de caché hacen que "cuándo publicar" sea más sutil que "qué publicar"

Jason Zhu - inline image

Hay un detalle en el código: cuando el número de publicaciones en el grupo de caché es >= 500, el sistema omite toda la lógica de extracción de publicaciones en tiempo real de Thunder/Phoenix/TweetMixer y devuelve directamente el contenido en caché.

Esto significa: para los usuarios intensivos que abren X docenas de veces al día, muchas de sus solicitudes no pasan por el algoritmo de recomendación en absoluto; ven una lista antigua en el caché de Redis.

Una publicación que acabas de enviar podría ser completamente invisible para estos usuarios intensivos. Tu contenido solo tiene la oportunidad de entrar cuando el caché se actualiza la próxima vez.

Esto también explica un fenómeno contraintuitivo: algunas cuentas publican docenas de veces al día y su tráfico no es malo. Esto se debe a que la publicación de alta frecuencia aumenta la probabilidad de "ser seleccionado en una actualización de caché determinada". Sin embargo, Punk2898 predice que esta estrategia se ajustará más tarde.

Para los creadores comunes, la sugerencia es: publica entre 10 y 30 minutos antes del pico de actividad de tu audiencia objetivo, para que tu publicación tenga más posibilidades de ser incluida cuando se actualice el caché.

Observación 7: MediumRisk es la reducción de peso oculta que no conoces

Jason Zhu - inline image

El código del sistema publicitario reveló por primera vez la variable brand_safety_verdict. Tiene cuatro niveles: Safe / LowRisk / MediumRisk / HighRisk.

Descubrimiento clave: El valor predeterminado es MediumRisk.

En otras palabras, si tu publicación no ha sido completamente revisada por Grox (o faltan etiquetas), el sistema te trata como "Riesgo Medio" por defecto. Las publicaciones de Riesgo Medio no se bloquean directamente, pero se evitan junto a los anuncios. Y las posiciones alrededor de los anuncios suelen ser áreas de alta exposición (áreas de enfoque visual del usuario).

El resultado es: nunca recibes ningún aviso de infracción, pero tu exposición ya está siendo descontada. Esta es la "sombra oculta" más fácil de pasar por alto en el algoritmo v2.

¿Cómo evitarlo? Las publicaciones con temas claros y sin contenido "polémico" tienen más probabilidades de clasificarse rápidamente como Safe. Después de publicar una publicación importante, espera de 30 a 60 minutos para que termine la revisión antes de hacer una promoción intensa.

Lista de verificación de acciones para creadores

Jason Zhu - inline image

Basado en las 7 observaciones anteriores, aquí hay pasos prácticos específicos:

En cuanto a la calidad del contenido

Las primeras 10 palabras de cada publicación determinan la permanencia o no. Debes crear una brecha cognitiva o un impacto de datos en la primera oración. Comenzar con "Hoy aprendí un pequeño truco" provoca directamente un deslizamiento.

El contenido debe tener argumentos claros, densidad de información y una sensación de estructura. El umbral de puntuación de calidad de 0.4 no es alto, pero las publicaciones de relleno "basadas en plantillas + baja información + pocas palabras con una imagen" definitivamente no pasarán.

Evita la sensación de plantilla de IA: estructuras de oraciones uniformes, comienzos fijos ("Primero... Segundo... Finalmente") y finales grandiosos serán detectados por slop_score.

En cuanto a las operaciones del círculo

Audita tu lista de seguidos. Deja de seguir cuentas al azar que no estén en tu círculo objetivo. Cada seguido da forma a tu coeficiente de Jaccard.

Síguete mutuamente con 5 a 10 cuentas principales en tu círculo objetivo. El peso del seguimiento mutuo es mucho mayor que el seguimiento unilateral.

En las publicaciones de las grandes cuentas del círculo, deja comentarios con incremento de información. No "lo aprendí", sino complementa un dato, comparte un contraejemplo o haz una pregunta de extensión.

En cuanto a la gestión de la sección de comentarios

Limpia regularmente los comentarios spam debajo de tus publicaciones. Los anuncios y las respuestas sin sentido reducirán el peso de la publicación principal.

No hagas spam de tu presencia debajo de publicaciones irrelevantes. Los comentarios de 0 puntos dejan un registro de spam en tu cuenta.

En cuanto al momento de la publicación

Publica entre 10 y 30 minutos antes del pico de actividad de tu audiencia objetivo. Deja una ventana para que la actualización del caché te incluya.

Espera de 30 a 60 minutos después de una publicación importante antes de promocionarla. Deja que la revisión de Grox termine para pasar de MediumRisk predeterminado a Safe.

En cuanto a los retuits con cita

Ten cuidado al citar contenido marginal. El mecanismo de responsabilidad conjunta VF v2 hará que la reducción de peso de las publicaciones penalizadas se extienda a ti a lo largo de la cadena de citas.

Usa capturas de pantalla + tus propios comentarios para contenido controvertido en lugar de citas directas.

En cuanto a los hashtags

Identifica 1 o 2 temas principales de Grok y crea contenido de manera consistente en torno a ellos. Los streams de descubrimiento de los nuevos usuarios están estrictamente filtrados por tema; si no estás en su conjunto de temas, no existes para ellos.

Ocasionalmente usa etiquetas # explícitas para fortalecer la clasificación de temas del algoritmo.

En cuanto al video

El primer segundo de un video es la línea de vida o muerte. La señal not_dwelled es más obvia en los videos.

El contenido importante debe tener una versión solo de texto. Algunos usuarios tienen habilitados filtros de "ver menos videos", y las publicaciones con campos de duración de video se eliminarán por completo.

Enlaces de referencia:

https://github.com/xai-org/x-algorithm

https://x.com/punk2898/status/2013538743467286981

https://x.com/punk2898/status/2055439323693289598

Save to YouMind

Use YouMind to read viral articles deeply

Save the source, ask focused questions, summarize the argument, and turn a viral article into reusable notes in one AI workspace.

Explore YouMind

Más patrones por descifrar

Artículos virales recientes

Explorar más artículos virales