AIが回答を生成する時代に、あなたのサイトは正しく「読まれて」いるでしょうか。
検索エンジンにはrobots.txtとsitemap.xmlで対応してきましたが、ChatGPTやClaudeなどの生成AIには、それとは別の案内ファイルが必要になってきました。それが llms.txt です。
この記事では、llms.txtの概要から書き方・ベストプラクティス・日本語サイトでの注意点まで、国内外の情報を整理してお伝えします。
llms.txtとは何か
llms.txtは、2024年9月にJeremy Howard(Answer.AI共同創業者・fast.ai創設者)が提唱した、AI向けのサイト案内ファイルです。
サイトのルート(https://example.com/llms.txt)に設置するMarkdown形式のテキストファイルで、LLMやAIエージェントに対して「このサイトには何があるか・どのページが重要か」を伝える役割を担います。
なぜ必要なのか
LLMのコンテキストウィンドウには限界があります。HTMLには広告・ナビゲーション・スクリプトが混在しており、AIが必要な情報だけを効率よく取り出すのは簡単ではありません。
llms.txtはこの問題を解決するために生まれました。人間向けのrobots.txtがクローラーへのアクセス制御を担うように、llms.txtはAIシステムへの「意味的な案内」を担います。
| ファイル | 対象 | 役割 |
|---|---|---|
| robots.txt | クローラー全般 | アクセス制御(どこを見ていい・ダメ) |
| sitemap.xml | 検索エンジン | URL全体の発見・インデックス促進 |
| llms.txt | LLM・AIエージェント | コンテンツの意味的ガイド(何が重要か) |
ファイル形式と構文ルール
基本仕様
- 設置場所: サイトルート(
https://example.com/llms.txt) - フォーマット: Markdown形式
- エンコーディング: UTF-8必須
- MIMEタイプ:
text/plain - HTTPステータス: 200 OK(404では無効)
必須要素はH1見出しのみ
# サイト名(プロジェクト名)
これが唯一の必須要素です。あとはすべて任意で追加します。
推奨セクション構成
# 株式会社サンプル
> サンプル社は日本の中小企業向けクラウド会計ソフトを提供するSaaS企業です(2015年創業)。
主な機能: 仕訳入力、確定申告、給与計算、経費精算。
対象ユーザー: 従業員50名以下の中小企業・個人事業主。
## ドキュメント
- [機能一覧](https://example.com/features): 全機能の詳細説明
- [価格プラン](https://example.com/pricing): 月額・年額プランと比較表
- [API リファレンス](https://example.com/api): REST API 仕様書
## Optional
- [採用情報](https://example.com/careers)
- [プレスリリース一覧](https://example.com/press)
各セクションの意味は次の通りです。
- H1(
#): サイト・プロジェクトの正式名称 - 引用ブロック(
>): サイトの概要を1〜3文で要約 - 本文テキスト: 詳細説明(対象ユーザー・主要機能など)
- H2 + リスト: 重要ページのURLリスト(カテゴリ別に分類)
## Optionalセクション: 優先度の低いリンク群(コンテキストが短い場合にスキップ可能)
実際の完成例(日本語SEOブログの場合)
以下は、SEO・Webマーケティング情報を発信するブログサイトのllms.txtとして、そのまま使える形で書いた例です。
# Webマーケティングラボ (Web Marketing Lab)
> 中小企業・個人事業主向けにSEO・コンテンツマーケティング・SNS運用の実践情報を発信する日本語ブログ。2018年開設。
運営者: 田中 健一(Webコンサルタント・SEO歴12年)
対象読者: 自社サイトを自力で強化したい経営者・マーケター担当者
更新頻度: 月4〜8本
最終更新: 2026-05-08
## SEO対策
- [SEO初心者ガイド完全版](https://example.jp/blog/seo-beginner-guide/): キーワード選定から内部対策まで基礎を網羅
- [Google検索アルゴリズム変動まとめ](https://example.jp/blog/algorithm/): コアアップデートの傾向と対処法
- [内部リンク設計の考え方](https://example.jp/blog/seo-internal/): サイト構造とクロール効率を改善する手順
- [SEOライティング実践ガイド](https://example.jp/blog/seo-writing-structure/): 検索上位を狙う記事構成のルール
## AI・最新トレンド
- [AI Overviewsとコンテンツ戦略](https://example.jp/blog/ai-overview-data/): 生成AI検索時代の記事設計
- [llms.txtの書き方](https://example.jp/blog/llms-txt-guide/): AI向けサイト案内ファイルの実装ガイド
## Webマーケティング
- [コンテンツマーケティング入門](https://example.jp/blog/contents-marketing/): 集客から成約までの設計図
- [SNS運用の基本](https://example.jp/blog/sns/): X・Instagram・LINE公式アカウントの使い分け
## Optional
- [サイトについて](https://example.jp/about/): 運営者プロフィールと発信方針
- [お問い合わせ](https://example.jp/contact/)
ポイントの解説
- サイト名に英語表記を併記し(括弧内)、英語圏のLLMにも正しく認識されるようにしている
- 引用ブロックにサイトの性格・対象読者・開設年を凝縮している
- H2でカテゴリを分け、重要度の高いコンテンツを上位セクションに置いている
- 各リンクの説明文は「何の疑問に答えるページか」を一言で示している
- 問い合わせページなどAIが参照しても意味の薄いページは
## Optionalに下げている
書くべきこと・避けるべきこと
書くべきこと
- 社名・サービス名を正式名称で明記(H1)
- 誰向けに何を提供しているかを具体的に記述
- 設立年・所在地など、AIがファクトシートとして使える情報
- 重要度の高いURLを優先的に記載
- 各リンクに1行の説明文(「何に答えるページか」を明示)
- 情報の更新日
避けるべきこと
- 「業界をリードするソリューション」「革新的なサービス」などの曖昧なマーケティング表現
- 説明のない裸のURLリスト
- コンテキストなしでは意味不明な社内用語・略語
- 誇張・不正確な記述(AIが誤った情報を拡散するリスクがあります)
- 廃止・変更済みの古い情報
構造上の推奨
AIは構造化されたテキストを優先して処理します。見出しとリストをうまく使い、最重要コンテンツをファイルの上部に置くと効果的です。推奨ファイルサイズは10KB以下です。
llms-full.txtとの違い
llms.txtと合わせてよく登場するのが llms-full.txt です。両者の役割は明確に異なります。
| 項目 | llms.txt | llms-full.txt |
|---|---|---|
| 役割 | ナビゲーションインデックス(目次) | 全コンテンツ完全収録(本棚) |
| サイズ目安 | 10KB以下 | 100KB以下 |
| 内容 | URLリスト + 説明 | 各ページの全文をMarkdownで収録 |
| 主な用途 | AIチャットボットが参照ページを判断する | Cursor・GitHub Copilotなど開発ツールが完全コンテキストを取得する |
llms-full.txtは、APIドキュメントや技術仕様書を持つ開発者向けサイトで特に有効です。両方実装するのがベストプラクティスとされています。
主要企業の実装例
2025年時点で、多くの有名サービスがllms.txtを実装しています。
| 企業 / プロジェクト | 特徴 |
|---|---|
| Anthropic(Claude) | ドキュメント生成ツール経由で早期実装 |
| Cloudflare | 大規模技術ドキュメントのナビゲーション用 |
| Stripe | APIドキュメントへの誘導 |
| Vercel | 開発者向けドキュメント整理 |
| Supabase | APIの正確な参照を確保 |
| Perplexity AI | 自社サービス説明 |
| Zapier | 自動化プラットフォームの機能案内 |
BuiltWithのデータでは2025年時点で約84万4千サイトが実装済みとされており、技術系・SaaS系サイトを中心に急速に普及しています。
AI検索最適化(GEO)との関係
GEO(Generative Engine Optimization) とは、ChatGPT・Claude・Perplexity・Google AI Overviewsなどの生成AIの回答内で自社が引用・言及されることを最大化する最適化手法です。llms.txtはGEOの構成要素のひとつです。
現時点での効果と限界
正直に言えば、llms.txtの効果はまだ限定的です。
- OpenAI・Google・Anthropic・Perplexityのいずれも、llms.txtを公式サポートするとは表明していない
- 30万ドメインを対象にした統計分析では、設置がLLMによる引用頻度に有意な影響を与えなかった(Rankabilityの調査)
- GoogleはSEOランキングへの直接的な影響はないと明言している(Gary Illyes, 2025年7月)
それでも実装する理由
一方で、実装するメリットも存在します。
- Perplexity AIなど一部のAI検索エンジンは実際にllms.txtを参照しているとされる
- AI経由のリファラルトラフィックは2025年前半に前年比527%増、コンバージョン率は通常オーガニック比4〜5倍という報告がある
- 設置コストが低く、デメリットはほぼない
- AIクローラーが普及した将来には標準的なインフラになる可能性がある
「今すぐ劇的な効果が出るわけではないが、低コストで先行できる保険」という捉え方が現時点では妥当です。
日本語サイトでの注意点
技術面
- エンコーディングは必ずUTF-8で保存する: Shift_JIS・EUC-JPで保存すると文字化けや読み込み失敗が起きます
- H1見出しの
#の後ろに半角スペースを入れること(Markdown仕様) - 全角スペースを避け、半角スペースで区切る
コンテンツ面
- 社名・サービス名は日本語と英語を併記すると英語圏のLLMにも正しく認識される(例:
# 株式会社サンプル (Sample Inc.)) - 敬語・丁寧語ではなく、箇条書きの平易な表現を使う(簡潔さが重要)
- URLには日本語(パーセントエンコード)を避け、英数字スラッグを使用することが望ましい
robots.txtとの整合性
AIクローラー(GPTBot・ClaudeBot・PerplexityBotなど)をrobots.txtでブロックしていると、llms.txtを置いても効果がありません。AI検索最適化を意図するなら、まずrobots.txtの設定を見直す必要があります。
まとめ
llms.txtは2024年9月に提唱された、Markdown形式のAIシステム向けサイト案内ファイルです。
- 必須要素はH1見出しのみ というシンプルな仕様
- 引用ブロック・リンクリスト・Optionalセクションで優先度を伝える
- llms-full.txtと合わせた両方実装がベストプラクティス
- 現時点では効果に限界があるが、低コストで先行できる施策
AI検索(ChatGPT・Claude・Perplexity)の利用が急増している今、llms.txtへの対応はGEO戦略の第一歩として検討する価値があります。設置コストはわずかなテキストファイル一枚です。まずは試しに設置するところから始めてみましょう。