[เจาะลึกโดย Ahrefs] การติดตั้ง llms.txt ช่วยเรื่อง AI Search จริงหรือ? ความจริงที่ว่า 97% ของไฟล์ "ไม่ถูกอ่าน"

@AhrefsJP
ญี่ปุ่น2 วันที่ผ่านมา · 01 ก.ค. 2569
241K
24
6
0
9

TL;DR

Ahrefs ได้วิเคราะห์โดเมนจำนวน 137,000 แห่งเพื่อทดสอบประสิทธิภาพของ llms.txt สำหรับ AI Search โดยพบว่า 97% ของไฟล์ไม่เคยถูกอ่านเลย และทราฟฟิกส่วนใหญ่มาจาก Coding Agents มากกว่า Search Bots

"การติดตั้ง llms.txt จะทำให้ AI อ้างอิงไซต์ของคุณได้ง่ายขึ้น"

ด้วยความเชื่อในข้อกล่าวอ้างนี้ หลายเว็บไซต์จึงได้เผยแพร่ไฟล์ llms.txt ไปแล้ว อย่างไรก็ตาม หลังจากที่ทีม Ahrefs วิเคราะห์บันทึกเซิร์ฟเวอร์จาก 137,000 โดเมน ก็พบว่า 97% ของไฟล์เหล่านั้นไม่เคยถูกอ่านแม้แต่ครั้งเดียว

llms.txt คืออะไร และทำไมถึงเป็นกระแส?

llms.txt เป็นไฟล์ดัชนีที่ออกแบบมาสำหรับเครื่องจักร ซึ่งถูกเสนอขึ้นในปี 2024 โดย Jeremy Howard ผู้ร่วมก่อตั้ง Answer.AI ไฟล์นี้จะถูกวางไว้ที่รากของเว็บไซต์และสรุปภาพรวมของไซต์พร้อมลิงก์ไปยังหน้าที่สำคัญในรูปแบบ Markdown

เป้าหมายคือ "เพื่อให้ LLM และเอเจนต์เข้าใจโครงสร้างโดยไม่ต้องรวบรวมข้อมูลทั้งเว็บไซต์" อย่างไรก็ตาม วงการ SEO ได้เพิ่มข้ออ้างในภายหลังว่ามัน "ทำให้ถูกอ้างอิงในการค้นหา AI ได้ง่ายขึ้น" และความคาดหวังก็เริ่มเป็นไปตามนั้นเอง

การตอบสนองของ Google ก็ยิ่งเพิ่มความสับสน

  • ใน คู่มือ AI เชิงสร้างสรรค์ พวกเขาระบุอย่างชัดเจนว่า "ไม่จำเป็นต้องมีไฟล์พิเศษอย่าง llms.txt"
  • ในขณะเดียวกัน Chrome Lighthouse ก็เพิ่มฟังก์ชันตรวจสอบ llms.txt ขึ้นมาในช่วงเวลาใกล้เคียงกัน

John Mueller จาก Google อธิบายว่า "ไม่ใช่เพื่อการค้นหา แต่เป็นเครื่องมือช่วยชั่วคราวสำหรับเครื่องมือเขียนโค้ด AI" แต่หลายเว็บไซต์ก็เริ่มดำเนินการติดตั้งด้วยความหวังว่าจะ "ถูกค้นพบโดย AI"

ภาพรวมการตรวจสอบ: วิเคราะห์บันทึกของ 137,000 โดเมนใน 1 เดือน

ทีม Ahrefs ใช้ Web Analytics และ Bot Analytics ดำเนินการตรวจสอบดังนี้:

  • เป้าหมาย: โดเมนทั้งหมด 137,210 โดเมนที่มีทราฟฟิกในเดือนพฤษภาคม 2026
  • การตรวจสอบ: วิเคราะห์คำขอไปยังพาธ /llms.txt ของแต่ละโดเมนโดยใช้การตอบสนอง HTTP และตัวแทนผู้ใช้
  • การควบคุมคุณภาพ: ไม่รวม soft 404 และไฟล์หลอน โดยนับเฉพาะไฟล์ Markdown จริงเท่านั้น

หมายเหตุ: เนื่องจากผู้ใช้ Ahrefs Web Analytics มักมีความรู้ด้านเทคนิคและ SEO สูง ให้ถือว่า อัตราการนำไปใช้ 28% เป็นค่าสูงสุด*

5 ประเด็นสำคัญจากผลการตรวจสอบ

✅ 28% ของเว็บไซต์เผยแพร่ llms.txt แล้ว

Ahrefs (エイチレフス) Japan 公式 - inline image

จาก 137,000 โดเมน เว็บไซต์ประมาณ 38,000 แห่งได้ติดตั้ง llms.txt

ไม่มีแพลตฟอร์ม AI ใดเคยประกาศอย่างเป็นทางการว่าอ่านไฟล์นี้ การนำไปใช้เป็นผลจากการคาดเดาว่าพวกมัน "อาจจะเริ่มใช้มัน" ไม่ใช่จากการยืนยันว่าพวกมันใช้จริง

✅ 97% ของไฟล์เหล่านั้นไม่มีการเข้าถึงเลย

Ahrefs (エイチレフス) Japan 公式 - inline image

จากประมาณ 38,000 โดเมนที่มี llms.txt ที่ถูกต้อง 97% ไม่มีคำขอใด ๆ เลยตลอดเดือนพฤษภาคม

ส่วนที่เหลืออีก 3% (ประมาณ 1,100 โดเมน) ได้รับทราฟฟิก llms.txt ทั้งหมดที่วัดได้ ณ จุดนี้ แม้ว่าคุณจะเผยแพร่ llms.txt ก็มีความเป็นไปได้สูงมากที่ไม่มีอะไรจะดึงข้อมูลมัน

✅ ใน 3% ที่ถูกอ่าน 96% เป็นการเข้าถึงจากบอท

llms.txt เป็นไฟล์ที่เขียนขึ้นสำหรับเครื่องจักร และในความเป็นจริง มีเพียงเครื่องจักรเท่านั้นที่อ่านมัน

การเข้าถึงจากมนุษย์คือ 4% ซึ่งรวมถึงมืออาชีพ SEO ที่ตรวจสอบเว็บไซต์คู่แข่ง และบอทขยายลิงก์เมื่อแชร์ลิงก์ llms.txt ในแอปแชท

น่าสนใจที่ Slackbot ดึงข้อมูล llms.txt บ่อยกว่า PerplexityBot ความจริงที่ว่าบอทแสดงตัวอย่างลิงก์สำหรับแอปแชทมีประสิทธิภาพเหนือกว่าบอทค้นหา AI แสดงให้เห็นถึงระดับความสนใจที่แท้จริงจากฝั่งการค้นหา AI อย่างชัดเจน

✅ บอท AI คิดเป็น 19.5% โดยผู้อ่านส่วนใหญ่คือเอเจนต์เขียนโค้ด

77% ของบอทที่ดึงข้อมูล llms.txt ไม่ใช่เครื่องมือ AI

บอท AI คิดเป็น 19.5% ของทั้งหมด แต่เมื่อแยกย่อยแล้วเผยให้เห็นความเป็นจริงที่แตกต่างจากความคาดหวัง:

  • AI Agents (Claude Code ฯลฯ): 10.5%
  • AI Training Crawlers (GPTBot ฯลฯ): 5.3%
  • AI Assistants: 2.5%
  • AI Search Retrieval Bots (Perplexity, OAI-SearchBot ฯลฯ): 1.1%

Claude Code เพียงตัวเดียวส่งคำขอมากกว่าบอทค้นหา AI ทั้งหมดรวมกัน

กล่าวอีกนัยหนึ่ง llms.txt ไม่ได้ถูกอ่านเพื่อ "ถูกอ้างอิงในการค้นหา AI" จริง ๆ แต่เพื่อ "ให้เอเจนต์เขียนโค้ดแยกวิเคราะห์เอกสาร" ซึ่งสอดคล้องกับคำอธิบายของ John Mueller อย่างสมบูรณ์

✅ บอท AI เป็นศูนย์ที่ "ไปค้นหา" llms.txt ที่ไม่มีอยู่

นี่คือสิ่งที่ชัดเจนที่สุด

เมื่อวิเคราะห์คำขอไปยังไฟล์ llms.txt ที่ไม่มีอยู่ (พาธที่ส่งคืน 404) การเข้าถึงจากบอท AI เป็นศูนย์

98% ของผู้ที่เข้าถึงหน้า 404 เป็นมนุษย์ (ส่วนใหญ่เป็นมืออาชีพ SEO ที่ทำการวิจัยคู่แข่ง) ระบบ AI ไม่ได้ค้นหาไฟล์นี้ด้วยตัวเอง พวกมันจะดึงข้อมูลก็ต่อเมื่อมีการทำให้รู้จักไฟล์ผ่านลิงก์ การจัดทำดัชนี หรือคำแนะนำจากผู้ใช้

คุณควรสร้าง llms.txt หรือไม่? ข้อดีและข้อเสีย

ข้อดี

  • ต้นทุนเกือบเป็นศูนย์: แพลตฟอร์มอย่าง Wix เริ่มสร้างไฟล์นี้โดยอัตโนมัติ ดังนั้นจึงใช้ความพยายามน้อยมาก
  • มีประสิทธิภาพสำหรับเอเจนต์เขียนโค้ด: หากลูกค้าของคุณใช้ Claude Code มันอาจถูกอ่านจริง ๆ
  • เตรียมพร้อมสำหรับอนาคต: Google ระบุว่าอนาคตของการค้นหาคือเอเจนต์ และมันอาจมีผลกระทบผ่านเลเยอร์เอเจนต์

ข้อเสีย

  • 97% ไม่ถูกอ่าน: อัตราพื้นฐานโหดร้ายเกินไป
  • ไม่มีผลต่อการค้นหา AI: ส่วนแบ่งของบอทค้นหา AI มีเพียง 1.1%
  • ความเสี่ยงด้านความปลอดภัย: เนื่องจากเอเจนต์ถูกออกแบบมาให้เชื่อถือไฟล์นี้ มันจึงอาจเป็นเป้าหมายของการฉีดพร้อมต์ นักวิจัยด้านความปลอดภัยกำลังตรวจสอบเรื่องนี้อยู่แล้ว

สรุป: หากคุณต้องการถูกอ้างอิงในการค้นหา AI มีสิ่งที่สำคัญกว่า llms.txt

ณ จุดนี้ ข้อเสียมีมากกว่าข้อดี

หากเป้าหมายของคุณคือปรากฏในการค้นหา AI มีวิธีอื่นที่เพิ่มการมองเห็นได้น่าเชื่อถือกว่า llms.txt

หากคุณยังคงต้องการพิจารณา เราแนะนำดังนี้:

  1. ตรวจสอบบันทึกของคุณเอง: อัตราพื้นฐานคือความน่าจะเป็น 97% ที่จะไม่มีผู้อ่าน
  2. ปล่อยให้ CMS สร้างอัตโนมัติ: หากผลลัพธ์ไม่แน่นอน การลดความพยายามให้เหลือน้อยที่สุดก็เป็นเรื่องสมเหตุสมผล
  3. นำทางเอเจนต์ไปยังไฟล์: AI จะไม่ดึงข้อมูลไฟล์เว้นแต่จะได้รับคำสั่ง ดังนั้นคุณต้องลิงก์ไปยังไฟล์จากที่ใดที่หนึ่ง

รายละเอียดวิธีการตรวจสอบ การแยกย่อยตามหมวดหมู่บอทอย่างสมบูรณ์ และรายละเอียดเกี่ยวกับความเสี่ยงด้านความปลอดภัย มีอธิบายไว้ในบล็อกโพสต์หลักของ Ahrefs 👉 https://ahrefs.com/blog/ja/llmstxt-study/

Turn one viral article into a full content workflow

Collect the source, decode the pattern, create assets, draft the story, and distribute from one AI workspace.

Explore YouMind

แพตเทิร์นให้ถอดรหัสเพิ่มเติม

บทความไวรัลล่าสุด

สำรวจบทความไวรัลเพิ่มเติม