【Ahrefs 調査】llms.txt の設置は AI 検索に有効か? 97% が「読まれていない」という現実

@AhrefsJP
日本語2 日前 · 2026年7月01日
241K
24
6
0
9

TL;DR

Ahrefs は AI 検索における llms.txt の有効性を検証するため、13 万 7000 ドメインを分析しました。その結果、ファイルの 97% は一度も読み込まれておらず、トラフィックの大部分は検索ボットではなくコーディングエージェントによるものであることが明らかになりました。

「llms.txt を設置すれば AI に引用されやすくなる」

この主張を信じて、すでに多くのサイトが llms.txt ファイルを公開しています。しかし、Ahrefs チームが 13.7 万ドメインのサーバーログを分析した結果、97% のファイルは一度も読まれていないことが判明しました。

llms.txt とは何か、なぜ話題になっているのか

llms.txt は、2024 年に Answer.AI の共同創設者ジェレミー・ハワードさんが提案した機械向けインデックスファイルです。サイトのルートに配置し、Markdown 形式でサイト概要と重要ページへのリンクをまとめます。

狙いは「LLM やエージェントがサイト全体をクロールせずに構造を把握できるようにする」こと。しかし、その後 SEO 業界が「AI 検索で引用されやすくなる」というフレーミングを後付けし、期待が一人歩きしました。

Google の対応も混乱を助長しています。

Google のジョン・ミューラー氏は「検索のためのものではなく、AI コーディングツール向けの一時的な補助手段」と説明していますが、すでに多くのサイトが「AI に見つけてもらえる」と期待して設置を進めていました。

調査の概要:13.7 万ドメイン × 1 ヶ月のログ分析

Ahrefs チームは、ウェブアナリティクスボットアナリティクスを使い、以下の調査を実施しました。

  • 対象:2026 年 5 月にトラフィックのあった全 137,210 ドメイン
  • 検証内容:各ドメインの /llms.txt パスへのリクエストを HTTP レスポンス別・ユーザーエージェント別に分析
  • 品質管理:ソフト 404 やファントムファイルを除外し、実際の Markdown ファイルのみをカウント

※ Ahrefs ウェブアナリティクスの利用者は技術・SEO 意識が高い傾向にあるため、28% という採用率は上限値と捉えてください。

調査結果が分かった 5 つのポイント

28% のサイトが llms.txt を公開済み

Ahrefs (エイチレフス) Japan 公式 - inline image

円グラフ:28% のサイトが有効な llms.txt を公開(38,360 ドメイン)、72% は未公開(98,640 ドメイン)

13.7 万ドメインのうち、約 38,000 サイトが llms.txt を設置していました。

AI プラットフォームがこのファイルを読むと公式に表明したことは一度もありません。採用を後押ししたのは「利用し始めるかもしれない」という推測であり、実際に利用しているという確認ではありませんでした。

そのうち 97% はアクセスゼロ

Ahrefs (エイチレフス) Japan 公式 - inline image

棒グラフ:Ahrefs の 13.7 万のドメイン調査で、llms.txt ファイルの 97% がリクエストされていないことを示す

有効な llms.txt を持つ約 38,000 ドメインのうち、97% は 5 月中にリクエストが一切ありませんでした

残りの 3%(約 1,100 ドメイン)が、測定された llms.txt トラフィックのすべてを受け取っていました。現時点で llms.txt を公開しても、圧倒的に高い確率で何もフェッチされないという結果です。

読まれた 3% のうち、96% はボットからのアクセス

llms.txt は機械向けに書かれたファイルであり、実際にそれを読んでいるのもほぼ機械だけです。

人間からのアクセスは 4% です。その中には、競合サイトをチェックする SEO 担当者や、チャットアプリで llms.txt のリンクを共有した際のリンク展開ボットも含まれています。

興味深いのは、Slackbot が PerplexityBot よりも高い頻度で llms.txt をフェッチしていたという点です。チャットアプリのリンクプレビューボットが AI 検索ボットを上回っているという事実は、AI 検索側の実際の関心度を如実に示しています。

AI ボットの割合は 19.5%、最大の読者はコーディングエージェント

llms.txt をフェッチしているボットの 77% は AI ツールではありません

AI ボットは全体の 19.5% を占めますが、内訳を見ると期待とは異なる実態が見えてきます。

  • AI エージェント(Claude Code など):10.5%
  • AI トレーニングクローラー(GPTBot など):5.3%
  • AI アシスタント:2.5%
  • AI 検索取得ボット(Perplexity、OAI-SearchBot など):1.1%

Claude Code 単体が、AI 検索取得ボット全体よりも多くのリクエストを送信していました。

つまり、llms.txt が実際に読まれているのは「AI 検索に引用されるため」ではなく、「コーディングエージェントがドキュメントを解析するため」です。ジョン・ミューラーさんの説明どおりの結果でした。

存在しない llms.txt を「探しに行く」AI ボットはゼロ

最も明確な発見がこれです。

存在しない llms.txt ファイル(404 を返すパス)へのリクエストを分析したところ、AI ボットからのアクセスはゼロでした。

404 ページにアクセスしていたのは 98% が人間(おそらく競合調査中の SEO 担当者)です。AI システムは自発的にこのファイルを探しに行くことはありません。リンク、インデックス、またはユーザーの指示によってファイルの存在が知らされた場合にのみ取得します。

llms.txt を作成すべきか:メリットとデメリット

メリット

  • コストがほぼゼロ:Wix などのプラットフォームが自動生成を始めており、労力は最小限
  • コーディングエージェント向けには有効:顧客が Claude Code などを使っている場合、実際に読まれる可能性がある
  • 将来への備え:Google は検索の未来がエージェント型であると明言しており、エージェント層を通じて影響が出る可能性はある

デメリット

  • 97% が読まれない:ベースレートが厳しすぎる
  • AI 検索には効果なし:AI 検索取得ボットのシェアはわずか 1.1%
  • セキュリティリスク:エージェントがこのファイルを信頼するよう設計されているため、プロンプトインジェクションの標的になりうる。すでにセキュリティ研究者が調査を進めている

結論:AI 検索で引用されたいなら llms.txt より優先すべきことがある

現時点では、デメリットがメリットを上回ります

AI 検索に表示されることが目標なら、llms.txt よりも確実に可視性を高める方法が他にあります。

それでも検討するなら、以下を推奨します。

  1. 自社ログを確認する:読者ゼロの確率が 97% というのがベースレート
  2. CMS の自動生成に任せる:効果が不確実なら労力を最小化するのが合理的
  3. エージェントをファイルに誘導する:AI は指示されなければ取得しないため、どこかからリンクを張る必要がある

調査の詳細な方法論、ボットカテゴリ別の完全な内訳、セキュリティリスクの詳細は Ahrefs ブログの本編記事で解説しています 👉 https://ahrefs.com/blog/ja/llmstxt-study/

Turn one viral article into a full content workflow

Collect the source, decode the pattern, create assets, draft the story, and distribute from one AI workspace.

Explore YouMind

解読すべきパターンをもっと

最近のバイラル記事

バイラル記事をもっと見る