[Investigación de Ahrefs] ¿Instalar llms.txt ayuda en la búsqueda por IA? La realidad es que el 97% "no se lee"

@AhrefsJP
JAPONÉShace 2 días · 01 jul 2026
241K
24
6
0
9

TL;DR

Ahrefs analizó 137,000 dominios para probar la efectividad de llms.txt en la búsqueda por IA. Descubrieron que el 97% de los archivos nunca se leen, y que la mayor parte del tráfico proviene de agentes de programación en lugar de bots de búsqueda.

"Instalar llms.txt hará que sea más fácil para la IA citar tu sitio."

Creyendo esta afirmación, muchos sitios ya han publicado archivos llms.txt. Sin embargo, después de que el equipo de Ahrefs analizara los registros del servidor de 137,000 dominios, se descubrió que el 97% de los archivos nunca se han leído ni una sola vez.

¿Qué es llms.txt y por qué está de moda?

llms.txt es un archivo de índice orientado a máquinas propuesto en 2024 por Jeremy Howard, cofundador de Answer.AI. Se coloca en la raíz de un sitio y resume la visión general del sitio y los enlaces a páginas importantes en formato Markdown.

El objetivo es "permitir que los LLM y los agentes comprendan la estructura sin tener que rastrear todo el sitio". Sin embargo, la industria del SEO añadió posteriormente el argumento de que "facilita ser citado en la búsqueda de IA", y las expectativas cobraron vida propia.

La respuesta de Google también ha contribuido a la confusión.

  • En su Guía de IA Generativa, afirmaron explícitamente que "archivos especiales como llms.txt no son necesarios".
  • Mientras tanto, Chrome Lighthouse añadió una función de verificación de llms.txt aproximadamente al mismo tiempo.

John Mueller, de Google, lo explicó como "no para la búsqueda, sino una ayuda temporal para herramientas de codificación de IA", pero muchos sitios ya estaban procediendo con la instalación con la esperanza de "ser encontrados por la IA".

Resumen de la investigación: Análisis de registros de 137,000 dominios durante 1 mes

El equipo de Ahrefs utilizó Web Analytics y Bot Analytics para llevar a cabo la siguiente investigación:

  • Objetivo: Los 137,210 dominios que tuvieron tráfico en mayo de 2026
  • Verificación: Se analizaron las solicitudes a la ruta /llms.txt para cada dominio por respuesta HTTP y agente de usuario
  • Control de calidad: Se excluyeron los soft 404 y los archivos fantasma, contando solo los archivos Markdown reales

Nota: Dado que los usuarios de Ahrefs Web Analytics tienden a tener un alto conocimiento técnico y de SEO, considere la tasa de adopción del 28% como un límite superior*.

5 puntos clave de los resultados de la investigación

✅ El 28% de los sitios han publicado llms.txt

Ahrefs (エイチレフス) Japan 公式 - inline image

De 137,000 dominios, aproximadamente 38,000 sitios tenían instalado llms.txt.

Ninguna plataforma de IA ha declarado oficialmente que lea este archivo. La adopción fue impulsada por la especulación de que "podrían empezar a usarlo", no por la confirmación de que realmente lo hacen.

✅ El 97% de esos archivos tienen cero accesos

Ahrefs (エイチレフス) Japan 公式 - inline image

De los aproximadamente 38,000 dominios con un llms.txt válido, el 97% tuvo cero solicitudes durante el mes de mayo.

El 3% restante (aproximadamente 1,100 dominios) recibió todo el tráfico de llms.txt medido. En este punto, incluso si publicas llms.txt, hay una probabilidad abrumadoramente alta de que nada lo solicite.

✅ Del 3% que se leyó, el 96% fue acceso de bots

llms.txt es un archivo escrito para máquinas y, en realidad, casi solo las máquinas lo leen.

El acceso de humanos es del 4%. Esto incluye profesionales de SEO que verifican sitios de la competencia y bots de expansión de enlaces cuando se comparte un enlace de llms.txt en aplicaciones de chat.

Curiosamente, Slackbot obtuvo llms.txt con más frecuencia que PerplexityBot. El hecho de que los bots de vista previa de enlaces para aplicaciones de chat superen a los bots de búsqueda de IA muestra claramente el nivel real de interés por parte del lado de la búsqueda de IA.

✅ Los bots de IA representan el 19.5%, siendo los agentes de codificación los que más leen

El 77% de los bots que obtienen llms.txt no son herramientas de IA.

Los bots de IA representan el 19.5% del total, pero un desglose revela una realidad diferente a las expectativas:

  • Agentes de IA (Claude Code, etc.): 10.5%
  • Rastreadores de entrenamiento de IA (GPTBot, etc.): 5.3%
  • Asistentes de IA: 2.5%
  • Bots de recuperación de búsqueda de IA (Perplexity, OAI-SearchBot, etc.): 1.1%

Claude Code por sí solo envió más solicitudes que todos los bots de recuperación de búsqueda de IA combinados.

En otras palabras, llms.txt no se lee realmente para "ser citado en la búsqueda de IA", sino para que "los agentes de codificación analicen la documentación". Esto se alinea perfectamente con la explicación de John Mueller.

✅ Cero bots de IA "buscan" un llms.txt inexistente

Este fue el descubrimiento más claro.

Al analizar las solicitudes a archivos llms.txt inexistentes (rutas que devuelven 404), el acceso de bots de IA fue cero.

El 98% de los que accedieron a páginas 404 eran humanos (probablemente profesionales de SEO haciendo investigación de la competencia). Los sistemas de IA no buscan espontáneamente este archivo. Solo lo recuperan si la existencia del archivo se da a conocer a través de enlaces, indexación o instrucciones del usuario.

¿Deberías crear llms.txt? Pros y contras

Pros

  • El costo es casi nulo: Plataformas como Wix están empezando a generarlos automáticamente, por lo que el esfuerzo es mínimo.
  • Efectivo para agentes de codificación: Si tus clientes usan Claude Code, podría ser realmente leído.
  • Prepararse para el futuro: Google ha declarado que el futuro de la búsqueda es agéntico, y podría tener un impacto a través de la capa de agentes.

Contras

  • El 97% no se lee: La tasa base es demasiado dura.
  • Sin efecto en la búsqueda de IA: La participación de los bots de recuperación de búsqueda de IA es de apenas el 1.1%.
  • Riesgos de seguridad: Dado que los agentes están diseñados para confiar en este archivo, puede ser un objetivo para la inyección de instrucciones. Los investigadores de seguridad ya están investigando esto.

Conclusión: Si quieres ser citado en la búsqueda de IA, hay prioridades más altas que llms.txt

En este punto, los contras superan a los pros.

Si tu objetivo es aparecer en la búsqueda de IA, hay otras formas de aumentar la visibilidad de manera más fiable que llms.txt.

Si aún así quieres considerarlo, te recomendamos lo siguiente:

  1. Revisa tus propios registros: La tasa base es una probabilidad del 97% de tener cero lectores.
  2. Déjalo en la generación automática del CMS: Si el efecto es incierto, es racional minimizar el esfuerzo.
  3. Guía a los agentes hacia el archivo: La IA no lo obtendrá a menos que se le indique, por lo que necesitas enlazarlo desde algún lugar.

La metodología detallada de la investigación, un desglose completo por categoría de bot y los detalles sobre los riesgos de seguridad se explican en el artículo principal del blog de Ahrefs 👉 https://ahrefs.com/blog/ja/llmstxt-study/

Turn one viral article into a full content workflow

Collect the source, decode the pattern, create assets, draft the story, and distribute from one AI workspace.

Explore YouMind

Más patrones por descifrar

Artículos virales recientes

Explorar más artículos virales