[Investigación de Ahrefs] ¿Instalar llms.txt ayuda en la búsqueda por IA? La realidad es que el 97% "no se lee"

@AhrefsJP
JAPONÉShace 2 días · 01 jul 2026
241K
24
6
0
9

TL;DR

Ahrefs analizó 137,000 dominios para probar la efectividad de llms.txt en la búsqueda por IA. Descubrieron que el 97% de los archivos nunca se leen, y que la mayor parte del tráfico proviene de agentes de programación en lugar de bots de búsqueda.

"Instalar llms.txt hará que sea más fácil para la IA citar tu sitio."

Creyendo esta afirmación, muchos sitios ya han publicado archivos llms.txt. Sin embargo, después de que el equipo de Ahrefs analizara los registros del servidor de 137,000 dominios, se descubrió que el 97% de los archivos nunca han sido leídos ni una sola vez.

¿Qué es llms.txt y por qué está de moda?

llms.txt es un archivo de índice orientado a máquinas propuesto en 2024 por Jeremy Howard, cofundador de Answer.AI. Se coloca en la raíz de un sitio y resume la descripción general del sitio y los enlaces a páginas importantes en formato Markdown.

El objetivo es "permitir que los LLM y los agentes comprendan la estructura sin rastrear todo el sitio". Sin embargo, la industria del SEO luego agregó el argumento de que "facilita ser citado en la búsqueda de IA", y las expectativas cobraron vida propia.

La respuesta de Google también ha contribuido a la confusión.

  • En su Guía de IA Generativa, afirmaron explícitamente que "archivos especiales como llms.txt no son necesarios".
  • Mientras tanto, Chrome Lighthouse agregó una función de verificación de llms.txt aproximadamente al mismo tiempo.

John Mueller de Google lo explicó como "no para la búsqueda, sino una ayuda temporal para herramientas de codificación de IA", pero muchos sitios ya estaban procediendo con la instalación con la esperanza de "ser encontrados por la IA".

Resumen de la investigación: Análisis de registros de 137,000 dominios durante 1 mes

El equipo de Ahrefs utilizó Web Analytics y Bot Analytics para realizar la siguiente investigación:

  • Objetivo: Todos los 137,210 dominios que tuvieron tráfico en mayo de 2026
  • Verificación: Se analizaron las solicitudes a la ruta /llms.txt para cada dominio por respuesta HTTP y agente de usuario
  • Control de calidad: Se excluyeron los soft 404 y los archivos fantasma, contando solo los archivos Markdown reales

Nota: Dado que los usuarios de Ahrefs Web Analytics tienden a tener un alto conocimiento técnico y de SEO, considere la tasa de adopción del 28% como un límite superior*.

5 puntos clave de los resultados de la investigación

✅ El 28% de los sitios han publicado llms.txt

Ahrefs (エイチレフス) Japan 公式 - inline image

De 137,000 dominios, aproximadamente 38,000 sitios habían instalado llms.txt.

Ninguna plataforma de IA ha declarado oficialmente que lea este archivo. La adopción fue impulsada por la especulación de que "podrían comenzar a usarlo", no por la confirmación de que realmente lo hacen.

✅ El 97% de esos tienen cero accesos

Ahrefs (エイチレフス) Japan 公式 - inline image

De los aproximadamente 38,000 dominios con un llms.txt válido, el 97% tuvo cero solicitudes durante el mes de mayo.

El 3% restante (aproximadamente 1,100 dominios) recibió todo el tráfico de llms.txt medido. En este punto, incluso si publicas llms.txt, hay una probabilidad abrumadoramente alta de que nada lo recupere.

✅ Del 3% que fue leído, el 96% fue acceso de bots

llms.txt es un archivo escrito para máquinas y, en realidad, casi solo las máquinas lo leen.

El acceso de humanos es del 4%. Esto incluye profesionales de SEO que verifican sitios de la competencia y bots de expansión de enlaces cuando se comparte un enlace de llms.txt en aplicaciones de chat.

Curiosamente, Slackbot recuperó llms.txt con más frecuencia que PerplexityBot. El hecho de que los bots de vista previa de enlaces para aplicaciones de chat superen a los bots de búsqueda de IA muestra claramente el nivel real de interés por parte de la búsqueda de IA.

✅ Los bots de IA representan el 19.5%, siendo los lectores más grandes los agentes de codificación

El 77% de los bots que recuperan llms.txt no son herramientas de IA.

Los bots de IA representan el 19.5% del total, pero un desglose revela una realidad diferente a las expectativas:

  • Agentes de IA (Claude Code, etc.): 10.5%
  • Rastreadores de entrenamiento de IA (GPTBot, etc.): 5.3%
  • Asistentes de IA: 2.5%
  • Bots de recuperación de búsqueda de IA (Perplexity, OAI-SearchBot, etc.): 1.1%

Claude Code solo envió más solicitudes que todos los bots de recuperación de búsqueda de IA combinados.

En otras palabras, llms.txt no se lee realmente para "ser citado en la búsqueda de IA", sino para que "los agentes de codificación analicen la documentación". Esto se alinea perfectamente con la explicación de John Mueller.

✅ Cero bots de IA "buscan" un llms.txt inexistente

Este fue el descubrimiento más claro.

Al analizar las solicitudes a archivos llms.txt inexistentes (rutas que devuelven 404), el acceso de bots de IA fue cero.

El 98% de los que accedieron a páginas 404 eran humanos (probablemente profesionales de SEO haciendo investigación de la competencia). Los sistemas de IA no buscan espontáneamente este archivo. Solo lo recuperan si la existencia del archivo se da a conocer a través de enlaces, indexación o instrucciones del usuario.

¿Deberías crear llms.txt? Pros y contras

Pros

  • El costo es casi cero: Plataformas como Wix están comenzando a generarlos automáticamente, por lo que el esfuerzo es mínimo.
  • Efectivo para agentes de codificación: Si tus clientes usan Claude Code, podría ser realmente leído.
  • Preparándose para el futuro: Google ha declarado que el futuro de la búsqueda es agéntico y podría tener un impacto a través de la capa de agentes.

Contras

  • El 97% no se lee: La tasa base es demasiado dura.
  • Sin efecto en la búsqueda de IA: La participación de los bots de recuperación de búsqueda de IA es de apenas el 1.1%.
  • Riesgos de seguridad: Dado que los agentes están diseñados para confiar en este archivo, puede ser un objetivo para la inyección rápida. Los investigadores de seguridad ya están investigando esto.

Conclusión: Si quieres ser citado en la búsqueda de IA, hay prioridades más altas que llms.txt

En este punto, los contras superan a los pros.

Si tu objetivo es aparecer en la búsqueda de IA, hay otras formas de aumentar la visibilidad de manera más confiable que llms.txt.

Si aún quieres considerarlo, te recomendamos lo siguiente:

  1. Revisa tus propios registros: La tasa base es una probabilidad del 97% de cero lectores.
  2. Déjalo en la generación automática del CMS: Si el efecto es incierto, es racional minimizar el esfuerzo.
  3. Guía a los agentes hacia el archivo: La IA no lo recuperará a menos que se le indique, por lo que debes enlazarlo desde algún lugar.

La metodología detallada de la investigación, un desglose completo por categoría de bot y detalles sobre los riesgos de seguridad se explican en el artículo principal del blog de Ahrefs 👉 https://ahrefs.com/blog/ja/llmstxt-study/

Turn one viral article into a full content workflow

Collect the source, decode the pattern, create assets, draft the story, and distribute from one AI workspace.

Explore YouMind

Más patrones por descifrar

Artículos virales recientes

Explorar más artículos virales