「安裝 llms.txt 會讓 AI 更容易引用你的網站。」
因為相信這個說法,許多網站已經發布了 llms.txt 檔案。然而,在 Ahrefs 團隊分析了來自 137,000 個域名的伺服器日誌後,發現 97% 的檔案從來沒有被讀取過一次。
什麼是 llms.txt,以及它為何成為趨勢?
llms.txt 是由 Answer.AI 的共同創辦人 Jeremy Howard 在 2024 年提出的機器導向索引檔案。它被放置在網站的根目錄,並以 Markdown 格式總結網站概覽及重要頁面的連結。
其目標是「讓 LLM 和 Agent 能夠在不爬取整個網站的情況下理解網站結構」。然而,SEO 業界後來加上了「這能讓網站更容易被 AI 搜尋引用」的論述,使得這份期待迅速升溫,超出了原本的範疇。
Google 的回應也加劇了混亂。
- 在他們的生成式 AI 指南中,明確指出「像 llms.txt 這類特殊檔案並非必要」。
- 與此同時,Chrome Lighthouse 大約在同一時間加入了 llms.txt 的檢查功能。
Google 的 John Mueller 解釋這是「非針對搜尋,而是 AI 編碼工具的暫時輔助」,但許多網站早已為了「希望被 AI 找到」而開始安裝這個檔案。
調查概覽:137,000 個域名的日誌分析(為期 1 個月)
Ahrefs 團隊使用 Web Analytics 和 Bot Analytics 進行了以下調查:
- 目標:2026 年 5 月期間有流量的所有 137,210 個域名
- 驗證方式:根據 HTTP 回應和使用者代理(User Agent)分析每個域名對 /llms.txt 路徑的請求
- 品質控制:排除了軟 404 和幽靈檔案,僅計數實際的 Markdown 檔案
注意:由於 Ahrefs Web Analytics 的使用者普遍具有較高的技術和 SEO 意識,請將 28% 的採用率視為上限*。
調查結果的 5 個關鍵要點
✅ 28% 的網站已發布 llms.txt

在 137,000 個域名中,約有 38,000 個網站已安裝 llms.txt。
沒有任何 AI 平台曾正式聲明他們會讀取這個檔案。採用率的增長是基於他們「可能開始使用它」的推測,而非基於他們確實會使用的確認。
✅ 其中 97% 的檔案零存取

在大約 38,000 個擁有有效 llms.txt 的域名中,97% 在 5 月份期間沒有任何請求。
其餘的 3%(約 1,100 個域名)則承受了所有被測量到的 llms.txt 流量。在現階段,即使你發布了 llms.txt,它被任何東西擷取的機率仍然極低。
✅ 在被讀取的 3% 中,96% 來自機器人(Bot)的存取
llms.txt 是為機器編寫的檔案,而實際上,幾乎只有機器在讀取它。
來自人類的存取佔 4%。這包括 SEO 專業人士檢查競爭對手網站,以及在聊天應用程式中分享 llms.txt 連結時,觸發的連結展開機器人。
有趣的是,Slackbot 擷取 llms.txt 的頻率比 PerplexityBot 還高。聊天應用程式連結預覽機器人的表現優於 AI 搜尋機器人,這清楚地顯示了 AI 搜尋方面實際的興趣程度。
✅ AI 機器人佔 19.5%,最大的讀取者是編碼 Agent(Coding Agents)
擷取 llms.txt 的機器人中,有 77% 並非 AI 工具。
AI 機器人佔總數的 19.5%,但進一步細分會發現一個與預期不符的現實:
- AI Agent(如 Claude Code 等):10.5%
- AI 訓練爬蟲(如 GPTBot 等):5.3%
- AI 助手:2.5%
- AI 搜尋檢索機器人(如 Perplexity、OAI-SearchBot 等):1.1%
僅 Claude Code 發出的請求就超過了所有 AI 搜尋檢索機器人的總和。
換句話說,llms.txt 實際上並非為了「被 AI 搜尋引用」而讀取,而是為了「讓編碼 Agent 解析文件」。這完全符合 John Mueller 的解釋。
✅ 零個 AI 機器人會「主動尋找」不存在的 llms.txt
這是最明確的發現。
在分析對不存在的 llms.txt 檔案(回傳 404 的路徑)的請求時,來自 AI 機器人的存取次數為零。
存取這些 404 頁面的 98% 是人類(很可能是進行競品研究的 SEO 專業人士)。AI 系統不會主動去尋找這個檔案。它們只會在檔案的存在透過連結、索引或被使用者指示而廣為人知時,才會去擷取它。
你應該建立 llms.txt 嗎?優缺點分析
優點
- 成本幾乎為零:像 Wix 這樣的平台已開始自動生成,因此所需心力極少。
- 對編碼 Agent 有效:如果你的客戶使用 Claude Code,它可能真的會被讀取。
- 為未來做準備:Google 已表示搜尋的未來是代理式的(agentic),未來可能透過 Agent 層產生影響。
缺點
- 97% 不會被讀取:基礎機率太過嚴峻。
- 對 AI 搜尋無效:AI 搜尋檢索機器人的佔比僅有 1.1%。
- 安全風險:由於 Agent 被設計為信任這個檔案,它可能成為提示注入攻擊的目標。安全研究人員已經在進行調查。
結論:如果你想被 AI 搜尋引用,有比 llms.txt 更優先的事項
在現階段,缺點大於優點。
如果你的目標是出現在 AI 搜尋結果中,有其他比 llms.txt 更可靠的方式來提高能見度。
如果你仍然想考慮採用,我們建議以下幾點:
- 檢查你自己的日誌:基礎機率是 97% 的機率沒有讀取者。
- 交由 CMS 自動生成:如果效果不確定,那麼將心力降到最低才是合理的。
- 引導 Agent 到該檔案:除非被指示,否則 AI 不會擷取它,因此你需要從某處連結到該檔案。
調查的詳細方法論、按機器人類別劃分的完整細分,以及安全風險的細節,均在 Ahrefs 主要部落格文章中說明 👉 https://ahrefs.com/blog/ja/llmstxt-study/





