ChatGPT等の生成系AI（LLM）にサイトのデータ収集方法を規定するllms.txtをワードプレスに設置する

投稿:2025年11月10日

ChatGPT等の生成系AI（LLM）にサイトのデータ収集方法を規定するllms.txtをワードプレスに設置する方法について解説いたします。

llms.txtとは？

llms.txtはサーバーに設置する生成AIにサイトのコンテンツの学習について規定するRobots.txtの生成AIバージョンです。
下記のようなURLでアクセス可能となっている必要がございます。

https://ワードプレスサイトのドメイン/llms.txt

llms.txtはChatGPT や Claude、Gemini などの大規模言語モデル（LLM）がウェブからデータを収集・学習するケースが増えるにつれ、「AIがこのサイトのコンテンツを学習に使っていいかどうか」を制御したいというニーズに対応するもので、まだ規格等は明確には定まっていないものの、All in one SEO等のプラグインではすでにこのファイルを生成する機能が提供されています。

llms.txtの設定例

テキストエディタで下記のようなテキストファイルを作成の上、サーバーに設置します。
(書式はマークダウン方式になります)

※書き換える必要のある個所は太字になっています
※不要な個所は削ってください。また、生成AIですので自然言語を理解しますので、複雑でない概念は自由に追加できるものと思われます。但し生成AIは英語ので句集されている物が多く、内容は英語で記載いただいた方が無難かもしれません。

# サイト名

> サイトの内容の簡単な説明文

Language: jp
License: © 企業名, All rights reserved.

—

## Documentation & Policies
– [Site Policy](https://サイトの利用規約のURL): General terms of use and copyright information
– [AI Use Policy](https://サイトのAI学習データ利用規約のURL): Guidelines on automated data collection and AI reuse
– [Contact](https://お問合せページのURL): For inquiries about data access or content usage

—

## Content Overview
– [About our company](https://企業情報等へのリンク): Information about the operating company
– [Features](https://サイトの主要なコンテンツ(カテゴリー等)へのリンク): Main Content of the Site

—

## APIs & Data Access
– [Public API](https://ワードプレスRSSへのリンク): RSS and JSON feeds (requires approval)
– [Data Reuse Policy](https://上記RSSデータ利用規約へのリンク): Rules for redistribution and automated crawling

—

## Optional
– [Authors](https://著者情報ページへのリンク): Contributors and their expertise
– [Sitemap](https://サイトマップへのリンク): Full site structure and archives

—

## Policy for LLMs and AI Crawlers

> AIのサイトの情報の利用に関する規約を自然言語で記載します(上記AI Use Policyの内容と同じでいいかと思います)

### AI Crawler Access Control
“`txt
User-Agent: *
Disallow: /

※“`txt　はコードブロックを意味します。おまじない的にとらえてください。

最後の行の

User-Agent: *
Disallow: /

は生成AIに関してはすべてのコンテンツの利用(クロール)を禁止するという意味になります。
下記のように書くとすべての生成AIに関してnewsというURL以下のコンテンツの利用(クロール)を許可するが、その他はすべて禁止するという事になります。

User-Agent: *
Disallow: /
Allow: /news/

ご参考になりましたら幸いです。

WordPress ワードプレスサイトのカスタマイズや修正・セキュリティー対策等のご依頼・ご相談はWPドクターまでお気軽にお送りください

関連記事:

SEOに強くなるワードプレス(WordPress) robots.txtの書き方
robots.txtとは、検索エンジンのクローラー(自動でウェブページを読んで収集するシステムです)がそのサイトの情報を収集する際に様々な指定を読み込むための設定ファイルです。上記の名称で、ウェブサイトのトップディレクトリに置いておくと、GoogleやYahoo,Bingなどの検索エンジンが読み込み、あなたのウェブサイトの情報を指定通りに収集してくれます。今回は、SEO上有利になるように基本的なrobots.txtの記載方法を解説いたします。...

WordPressのAJAXを利用してStripe(ストライプ)の課金ボタンを表示する方法
Stripeはクレジットカード決済を代行するウェブサービスです。今回はこのサービスを利用して非常にシンプルな高んひゅうボタンをワードプレスに実装する方法を解説いたします。プラグインでショートコードからStripe課金ボタンを表示する仕組みを構築まず簡単なプラグインのひな型を準備して、ショートコードを定義します。...

ワードプレスのサイトマップ（検索エンジン用とユーザー用）の生成とRobots.txtの設定
ワードプレスのサイトに検索エンジン用サイトマップと、ユーザー用のサイトマップの自動生成を行うプラグインで最もお勧めな物、またRobots.txtを使用してGoogle以外の検索エンジンにもサイトマップの場所を通知する方法をご紹介いたします。...

WordPress サイトの seoパワー上昇させる２０の基本内部対策
ワードプレスは一般にSEOに強いといわれています。これには様々な理由がありますが多数のSEOを補佐するプラグイン、そもそもの設計がサイトの構造化がきちんとできるようにできている、カテゴリーやタグの仕組みが最初からついているなどが挙げられます。しかし、ワードプレスで作ったからといってSEOで上位にくる事が保証されている訳ではありません、ここではワードプレスでどのようなSEO施策をすればさらに検索エンジンで上位を狙えるかについて２０項目にわたって説明いたします。 0-1.SEOとは何か？そもそもなぜSEO(検索エンジン最適化)が必要なのでしょうか？たとえば、あなたがワインの販売サイトを作ったとします。非常にきれいな写真を撮り、一流デザイナーが美しいレイアウトに仕上げました。誰に見せてもすばらしいワインのサイトだと絶賛されあなたはこれでワインの売り上げが一気にあがると考えます。...

ChatGPTやGrok等のAIがワードプレスサイトのコンテンツで勝手に学習したり、検索して出力するのに使用されるのを防ぐには？
ChatGPTやGrok等のAIがワードプレスサイトのコンテンツで勝手に学習したり、検索して出力するのに使用されるのを防ぐ(ブロックする)方法を解説いたします。...

著者 WPドクター技術開発部(リーダー工藤)

ワードプレスサイトの構築経験は３０サイト以上。PHP開発エンジニア。ワードプレスの保守関連タスクを統括して公正な価格と作業期間で請け負うサービス(当WPドクターサービス)の立案にかかわり立ち上げから参加。ワードプレスのプログラミング言語であるPHPプログラミングの経験は、10年以上。ワードプレス関連タスクや開発の経験も豊富。ワードプレスに限らずLaravelやCake PHP、Composerなどを利用した開発フレームワーク案件、API開発案件、大手企業や官庁者の様々な開発プロジェクトにもかかわる。

著者の記事一覧(カテゴリーカスタマイズ・修正)
Wordpress.org公式アカウント

API EC HTTPS RSS サイトマッププラグイン

WordPress　WPドクターBlog　タグ一覧

前へ

ワードプレス依頼事例(WPドクター):マルウェア感染により別の通販のようなサイト写真が表示される問題のご解決

次へ

ワードプレスのマルウェア駆除後の再感染率を下げる運用設計

WPドクターでは、Wordpress カスタマイズや修正、復旧、移行（引っ越し）、エラー修正等のご依頼お安く承ります。お見積もりは無料です。

WPドクター:マルウェアスキャンプラグインはウィルスパターン定義データベースを利用して御社のワードプレスのファイルを内部からスキャン。マルウェアやウィルス改ざんの検査や駆除、除染、脆弱性検査ができる無料の高速スキャンプログラムです。

強力なマルウェア検出パターンで、PHP、HTML、JAVASCRIPT(JS)のコードやファイル、サイトURLからマルウェアが含まれているかをスキャンできる無料のオンラインサービスです。

ワードプレス脆弱性データベースは対応が必要な最も危険性の高いワードプレスやプラグインの脆弱性を検索できるページです。脆弱性の危険性はCVSSスコアに基づき分類されており、主にCVSS７．５ポイント以上の脆弱性データから検索できます。

＊当サイトへのリンクはご自由にしていただいて構いません。また、引用元をリンクしていただく事、記事のテキストを一部しか使用されない場合は、このブログの情報は自由に転載されても問題ございません。
情報がお役に立ちましたらあなたのメディアから当サイトの記事をご紹介いただけると幸いです。

＊当サイトのこの規約が表示されているページのコンテンツは生成AIにおける学習用の利用を禁止いたします。生成AIが検索結果として当サイトのコンテンツを表示する場合は引用元をリンクし、記事の概要のみを表示することを条件として許諾いたします。
カテゴリー

seo (31)

WordPress (2)

アクセス解析 (6)

アップデート情報 (4)

ウィジェット (2)

エラー (54)

カスタマイズ・修正 (453)

セキュリティ・脆弱性・マルウェア駆除 (363)

データベース (15)

バグ・不具合　復旧 (186)

プラグイン・テーマ (25)

マルチサイト (6)

レンタルサーバー (2)

ログイン (5)

使い方 (88)

保守管理・更新 (18)

文字化け (1)

有料テーマ (2)

無料テーマ (2)

真っ白 (2)

移行・引っ越し (47)

管理画面 (4)

高速化・重い (13)

人気の記事

ワードプレスcURL error 60: SSL certificate problem エラーによるアップデート不全を解消するにはカテゴリ: セキュリティ・脆弱性・マルウェア駆除

【無料】ワードプレス:マルウェアスキャン＆セキュリティープラグイン [マルウェア・ウィルス検出と駆除] カテゴリ: セキュリティ・脆弱性・マルウェア駆除

ワードプレスサイトがスマホでどのように見えるかPCで確かめる方法カテゴリ: 使い方

ワードプレスの投稿やコメントの日付・時間を表示しない(消す)方法カテゴリ: カスタマイズ・修正

ワードプレスの投稿や固定ページが４０４(存在しない)エラーになる場合の対処方法カテゴリ: バグ・不具合　復旧

ワードプレス「このサイトにアクセスできません」DNS_PROBE_FINISHED_NXDOMAINの修正方法カテゴリ: バグ・不具合　復旧

ワードプレスでContent-Security-Policyを設定し外部読み込みの不正なJAVASCRIPTの実行をさせないようにするカテゴリ: セキュリティ・脆弱性・マルウェア駆除

ワードプレスサイトをDeepLで翻訳できるプラグインDeepL for WordPress : translation plugin カテゴリ: 使い方

サイトにアクセスしてきたIPが危険なIPかどうか調べる方法カテゴリ: セキュリティ・脆弱性・マルウェア駆除

ワードプレスサイトをPHP8.3にしたらWarning: Trying to access array offset on false in ファイル名 on line が出た場合の対処方法カテゴリ: バグ・不具合　復旧

WPドクター

Address: 東京都港区南麻布１−５−８
Email: wpdoctorsales＠gmail.com
Business hours: 月曜日 – 金曜日: 9:00 am – 18:00 pm 日曜、祝祭日: 定休日
Company: 株式会社 BLUE GARAGE
適格請求書発行事業者登録済(インボイス対応)
▶ プライバシーポリシー
▶ 特定商取引法に基づく表記