[Enquête Ahrefs] L'installation de llms.txt aide-t-elle au référencement par l'IA ? La réalité : 97 % des fichiers ne sont « jamais lus »

@AhrefsJP
JAPONAISil y a 2 jours · 01 juil. 2026
241K
24
6
0
9

TL;DR

Ahrefs a analysé 137 000 domaines pour tester l'efficacité du fichier llms.txt dans la recherche par IA. Ils ont constaté que 97 % des fichiers ne sont jamais lus, la majeure partie du trafic provenant d'agents de codage plutôt que de bots de recherche.

« Installer llms.txt permettra à l'IA de citer plus facilement votre site. »

Convaincus par cette affirmation, de nombreux sites ont déjà publié des fichiers llms.txt. Cependant, après que l'équipe d'Ahrefs a analysé les journaux de serveur de 137 000 domaines, il a été découvert que 97 % des fichiers n'ont jamais été lus, même une seule fois.

Qu'est-ce que llms.txt et pourquoi est-ce tendance ?

llms.txt est un fichier d'index orienté machine proposé en 2024 par Jeremy Howard, co-fondateur d'Answer.AI. Placé à la racine d'un site, il résume la présentation du site et les liens vers les pages importantes au format Markdown.

L'objectif est de « permettre aux LLM et aux agents de comprendre la structure sans avoir à explorer l'intégralité du site ». Cependant, l'industrie du SEO a ensuite ajouté l'idée qu'il « facilite la citation dans les recherches IA », et les attentes ont pris une vie propre.

La réponse de Google a également ajouté à la confusion.

  • Dans leur Guide de l'IA générative, ils ont explicitement déclaré que « des fichiers spéciaux comme llms.txt ne sont pas nécessaires ».
  • Parallèlement, Chrome Lighthouse a ajouté une fonction de vérification de llms.txt à peu près à la même époque.

John Mueller de Google a expliqué qu'il s'agissait « non pas pour la recherche, mais d'une aide temporaire pour les outils de codage IA », mais de nombreux sites procédaient déjà à l'installation dans l'espoir d'« être trouvés par l'IA ».

Aperçu de l'enquête : Analyse des logs de 137 000 domaines sur 1 mois

L'équipe d'Ahrefs a utilisé Web Analytics et Bot Analytics pour mener l'enquête suivante :

  • Cible : Les 137 210 domaines ayant eu du trafic en mai 2026
  • Vérification : Analyse des requêtes vers le chemin /llms.txt pour chaque domaine par réponse HTTP et agent utilisateur
  • Contrôle qualité : Exclusion des soft 404 et des fichiers fantômes, en ne comptant que les fichiers Markdown réels

Remarque : Les utilisateurs d'Ahrefs Web Analytics ayant généralement une forte conscience technique et SEO, considérez le taux d'adoption de 28 % comme une limite supérieure*.

5 points clés des résultats de l'enquête

✅ 28 % des sites ont publié llms.txt

Ahrefs (エイチレフス) Japan 公式 - inline image

Sur 137 000 domaines, environ 38 000 sites avaient installé llms.txt.

Aucune plateforme d'IA n'a jamais officiellement déclaré lire ce fichier. L'adoption a été motivée par la spéculation selon laquelle ils « pourraient commencer à l'utiliser », et non par la confirmation qu'ils le font réellement.

✅ 97 % d'entre eux ont un accès nul

Ahrefs (エイチレフス) Japan 公式 - inline image

Sur les quelque 38 000 domaines avec un llms.txt valide, 97 % n'ont eu aucune requête pendant le mois de mai.

Les 3 % restants (environ 1 100 domaines) ont reçu tout le trafic llms.txt mesuré. À ce stade, même si vous publiez un llms.txt, il y a une probabilité extrêmement élevée que rien ne le récupère.

✅ Parmi les 3 % qui ont été lus, 96 % étaient des accès de bots

llms.txt est un fichier écrit pour les machines, et en réalité, seules les machines le lisent presque exclusivement.

L'accès par des humains est de 4 %. Cela inclut les professionnels du SEO vérifiant les sites concurrents et les bots d'expansion de liens lorsqu'un lien llms.txt est partagé dans des applications de chat.

Fait intéressant, Slackbot a récupéré llms.txt plus fréquemment que PerplexityBot. Le fait que les bots d'aperçu de liens pour les applications de chat surpassent les bots de recherche IA montre clairement le niveau d'intérêt réel du côté de la recherche IA.

✅ Les bots IA représentent 19,5 %, les plus grands lecteurs étant les agents de codage

77 % des bots qui récupèrent llms.txt ne sont pas des outils d'IA.

Les bots IA représentent 19,5 % du total, mais une ventilation révèle une réalité différente des attentes :

  • Agents IA (Claude Code, etc.) : 10,5 %
  • Crawlers d'entraînement IA (GPTBot, etc.) : 5,3 %
  • Assistants IA : 2,5 %
  • Bots de récupération pour la recherche IA (Perplexity, OAI-SearchBot, etc.) : 1,1 %

Claude Code a envoyé à lui seul plus de requêtes que tous les bots de récupération de recherche IA combinés.

En d'autres termes, llms.txt n'est pas réellement lu pour « être cité dans la recherche IA », mais pour que « les agents de codage analysent la documentation ». Cela correspond parfaitement à l'explication de John Mueller.

✅ Zéro bot IA « cherche » un llms.txt inexistant

C'est la découverte la plus claire.

En analysant les requêtes vers des fichiers llms.txt inexistants (chemins retournant 404), l'accès par les bots IA était nul.

98 % de ceux qui accédaient aux pages 404 étaient des humains (probablement des professionnels du SEO faisant des recherches sur la concurrence). Les systèmes d'IA ne partent pas spontanément à la recherche de ce fichier. Ils ne le récupèrent que si l'existence du fichier est signalée via des liens, l'indexation ou des instructions utilisateur.

Faut-il créer un llms.txt ? Avantages et inconvénients

Avantages

  • Le coût est quasi nul : Des plateformes comme Wix commencent à les générer automatiquement, donc l'effort est minime.
  • Efficace pour les agents de codage : Si vos clients utilisent Claude Code, il pourrait effectivement être lu.
  • Se préparer pour l'avenir : Google a déclaré que l'avenir de la recherche est agentique, et cela pourrait avoir un impact via la couche agent.

Inconvénients

  • 97 % ne sont pas lus : Le taux de base est trop défavorable.
  • Aucun effet sur la recherche IA : La part des bots de récupération de recherche IA n'est que de 1,1 %.
  • Risques de sécurité : Comme les agents sont conçus pour faire confiance à ce fichier, il peut être une cible pour l'injection de prompts. Les chercheurs en sécurité étudient déjà cela.

Conclusion : Si vous voulez être cité dans la recherche IA, il y a des priorités plus élevées que llms.txt

À ce stade, les inconvénients l'emportent sur les avantages.

Si votre objectif est d'apparaître dans la recherche IA, il existe d'autres moyens d'augmenter la visibilité de manière plus fiable que llms.txt.

Si vous souhaitez tout de même l'envisager, nous vous recommandons ce qui suit :

  1. Vérifiez vos propres logs : Le taux de base est une probabilité de 97 % d'avoir zéro lecteur.
  2. Laissez faire la génération automatique du CMS : Si l'effet est incertain, il est rationnel de minimiser l'effort.
  3. Guide les agents vers le fichier : L'IA ne le récupérera pas sans instruction, vous devez donc y faire un lien depuis quelque part.

La méthodologie détaillée de l'enquête, une répartition complète par catégorie de bots et les détails sur les risques de sécurité sont expliqués dans l'article principal du blog Ahrefs 👉 https://ahrefs.com/blog/ja/llmstxt-study/

Turn one viral article into a full content workflow

Collect the source, decode the pattern, create assets, draft the story, and distribute from one AI workspace.

Explore YouMind

D'autres patterns à décoder

Articles viraux récents

Explorer plus d'articles viraux