「llms.txt を設置すれば AI に引用されやすくなる」
この主張を信じて、すでに多くのサイトが llms.txt ファイルを公開しています。しかし、Ahrefs チームが 13.7 万ドメインのサーバーログを分析した結果、97% のファイルは一度も読まれていないことが判明しました。
llms.txt とは何か、なぜ話題になっているのか
llms.txt は、2024 年に Answer.AI の共同創設者ジェレミー・ハワードさんが提案した機械向けインデックスファイルです。サイトのルートに配置し、Markdown 形式でサイト概要と重要ページへのリンクをまとめます。
狙いは「LLM やエージェントがサイト全体をクロールせずに構造を把握できるようにする」こと。しかし、その後 SEO 業界が「AI 検索で引用されやすくなる」というフレーミングを後付けし、期待が一人歩きしました。
Google の対応も混乱を助長しています。
- 生成 AI ガイドでは「llms.txt のような特別なファイルは不要」と明言
- Chrome Lighthouseは同時期に llms.txt チェック機能を追加
Google のジョン・ミューラー氏は「検索のためのものではなく、AI コーディングツール向けの一時的な補助手段」と説明していますが、すでに多くのサイトが「AI に見つけてもらえる」と期待して設置を進めていました。
調査の概要:13.7 万ドメイン × 1 ヶ月のログ分析
Ahrefs チームは、ウェブアナリティクスとボットアナリティクスを使い、以下の調査を実施しました。
- 対象:2026 年 5 月にトラフィックのあった全 137,210 ドメイン
- 検証内容:各ドメインの /llms.txt パスへのリクエストを HTTP レスポンス別・ユーザーエージェント別に分析
- 品質管理:ソフト 404 やファントムファイルを除外し、実際の Markdown ファイルのみをカウント
※ Ahrefs ウェブアナリティクスの利用者は技術・SEO 意識が高い傾向にあるため、28% という採用率は上限値と捉えてください。
調査結果が分かった 5 つのポイント
✅ 28% のサイトが llms.txt を公開済み

円グラフ:28% のサイトが有効な llms.txt を公開(38,360 ドメイン)、72% は未公開(98,640 ドメイン)
13.7 万ドメインのうち、約 38,000 サイトが llms.txt を設置していました。
AI プラットフォームがこのファイルを読むと公式に表明したことは一度もありません。採用を後押ししたのは「利用し始めるかもしれない」という推測であり、実際に利用しているという確認ではありませんでした。
✅ そのうち 97% はアクセスゼロ

棒グラフ:Ahrefs の 13.7 万のドメイン調査で、llms.txt ファイルの 97% がリクエストされていないことを示す
有効な llms.txt を持つ約 38,000 ドメインのうち、97% は 5 月中にリクエストが一切ありませんでした。
残りの 3%(約 1,100 ドメイン)が、測定された llms.txt トラフィックのすべてを受け取っていました。現時点で llms.txt を公開しても、圧倒的に高い確率で何もフェッチされないという結果です。
✅ 読まれた 3% のうち、96% はボットからのアクセス
llms.txt は機械向けに書かれたファイルであり、実際にそれを読んでいるのもほぼ機械だけです。
人間からのアクセスは 4% です。その中には、競合サイトをチェックする SEO 担当者や、チャットアプリで llms.txt のリンクを共有した際のリンク展開ボットも含まれています。
興味深いのは、Slackbot が PerplexityBot よりも高い頻度で llms.txt をフェッチしていたという点です。チャットアプリのリンクプレビューボットが AI 検索ボットを上回っているという事実は、AI 検索側の実際の関心度を如実に示しています。
✅ AI ボットの割合は 19.5%、最大の読者はコーディングエージェント
llms.txt をフェッチしているボットの 77% は AI ツールではありません。
AI ボットは全体の 19.5% を占めますが、内訳を見ると期待とは異なる実態が見えてきます。
- AI エージェント(Claude Code など):10.5%
- AI トレーニングクローラー(GPTBot など):5.3%
- AI アシスタント:2.5%
- AI 検索取得ボット(Perplexity、OAI-SearchBot など):1.1%
Claude Code 単体が、AI 検索取得ボット全体よりも多くのリクエストを送信していました。
つまり、llms.txt が実際に読まれているのは「AI 検索に引用されるため」ではなく、「コーディングエージェントがドキュメントを解析するため」です。ジョン・ミューラーさんの説明どおりの結果でした。
✅ 存在しない llms.txt を「探しに行く」AI ボットはゼロ
最も明確な発見がこれです。
存在しない llms.txt ファイル(404 を返すパス)へのリクエストを分析したところ、AI ボットからのアクセスはゼロでした。
404 ページにアクセスしていたのは 98% が人間(おそらく競合調査中の SEO 担当者)です。AI システムは自発的にこのファイルを探しに行くことはありません。リンク、インデックス、またはユーザーの指示によってファイルの存在が知らされた場合にのみ取得します。
llms.txt を作成すべきか:メリットとデメリット
メリット
- コストがほぼゼロ:Wix などのプラットフォームが自動生成を始めており、労力は最小限
- コーディングエージェント向けには有効:顧客が Claude Code などを使っている場合、実際に読まれる可能性がある
- 将来への備え:Google は検索の未来がエージェント型であると明言しており、エージェント層を通じて影響が出る可能性はある
デメリット
- 97% が読まれない:ベースレートが厳しすぎる
- AI 検索には効果なし:AI 検索取得ボットのシェアはわずか 1.1%
- セキュリティリスク:エージェントがこのファイルを信頼するよう設計されているため、プロンプトインジェクションの標的になりうる。すでにセキュリティ研究者が調査を進めている
結論:AI 検索で引用されたいなら llms.txt より優先すべきことがある
現時点では、デメリットがメリットを上回ります。
AI 検索に表示されることが目標なら、llms.txt よりも確実に可視性を高める方法が他にあります。
それでも検討するなら、以下を推奨します。
- 自社ログを確認する:読者ゼロの確率が 97% というのがベースレート
- CMS の自動生成に任せる:効果が不確実なら労力を最小化するのが合理的
- エージェントをファイルに誘導する:AI は指示されなければ取得しないため、どこかからリンクを張る必要がある
調査の詳細な方法論、ボットカテゴリ別の完全な内訳、セキュリティリスクの詳細は Ahrefs ブログの本編記事で解説しています 👉 https://ahrefs.com/blog/ja/llmstxt-study/





