エブリサイトでは、以下2つの設定の組み合わせによって、公開時の robots.txt と各ページの noindex, nofollow の付与内容が決まります。
サイトの設定:サイト基本設定の「インデックスの許可」
ページの設定:ページ基本設定の「検索エンジンへのインデックスの許可」
このページでは、それぞれの設定がどのように反映されるのかを説明します。
設定項目
サイト基本設定の「インデックスの許可」
選べる値は以下の3つです。
検索エンジン・生成AIともにインデックスを許可する
生成AIのインデックスは許可するが、検索エンジンのインデックスは許可しない
検索エンジン・生成AIともにインデックスを許可しない
初期値は 「検索エンジン・生成AIともにインデックスを許可する」 です。
ページ基本設定の「検索エンジンへのインデックスの許可」
選べる値は以下の2つです。
インデックスを許可する
インデックスを許可しない
初期値は 「インデックスを許可する」 です。
動作の考え方
まず、サイト全体の設定によって大きな方針が決まります。そのうえで、必要に応じてページごとの noindex, nofollow が付与されます。
サイト全体でインデックスを許可する設定 の場合
→ ページごとの設定が反映されます。サイト全体で検索エンジンのインデックスを許可しない設定 の場合
→ 公開対象の全ページにメタタグとして noindex, nofollow が付きます。robots.txt には、サイト全体の設定に応じた制御内容が出力されます。
設定ごとの結果
以下の表のとおり、サイト設定に応じて robots.txt とページへの noindex, nofollow の付き方が変わります。
robots.txt のパターン
パターンA
すべてのクローラーに対してクロールを許可します。
User-agent: *
Disallow:
パターンB
以下の検索エンジンおよび生成AI関連のクローラーにはクロールを許可し、それ以外にはクロールを許可しません。
User-agent: GoogleBot
User-agent: BingBot
User-agent: DuckDuckBot
User-agent: GPTBot
User-agent: ChatGPT-User
User-agent: Google-Extended
User-agent: ClaudeBot
User-agent: Claude-User
User-agent: PerplexityBot
User-agent: Perplexity-User
Disallow:
User-agent: *
Disallow: /
パターンC
以下の検索エンジンクローラーにはクロールを許可し、それ以外にはクロールを許可しません。
User-agent: GoogleBot
User-agent: BingBot
User-agent: DuckDuckBot
Disallow:
User-agent: *
Disallow: /
各設定の組み合わせ例
サイト設定が「検索エンジン・生成AIともにインデックスを許可する」の場合
サイト全体としては公開可能な状態です。
ただし、ページごとに「インデックスを許可しない」を選んだページには noindex, nofollow が付きます。
robots.txt は パターンA になります。
つまり、ページ単位で検索結果に出したくないページだけを除外したい場合 に使います。
サイト設定が「生成AIのインデックスは許可するが、検索エンジンのインデックスは許可しない」の場合
公開対象の 全ページに noindex, nofollow が付きます。
robots.txt は パターンB になります。
ページごとの「インデックスを許可する / しない」の設定にかかわらず、全体方針が優先されます。
つまり、検索エンジンにはインデックスさせたくないが、生成AI関連のアクセス方針はパターンBに従う 場合の設定です。
サイト設定が「検索エンジン・生成AIともにインデックスを許可しない」の場合
公開対象の全ページに noindex, nofollow が付きます。
robots.txt は パターンC になります。
ページごとの設定にかかわらず、全体方針が優先されます。
つまり、サイト全体としてインデックスを許可しない 場合の設定です。
ベースページの扱い
ベースページ は、ページ基本設定の「検索エンジンへのインデックスの許可」に関係なく、 「インデックスを許可する」とみなしてテスト公開 されます。
そのため、ベースページのテスト公開時は、通常ページとは挙動が異なる場合があります。
実現したい設定の仕方
1. サイト全体は公開したいが、一部ページだけ検索結果に出したくない
サイト設定:検索エンジン・生成AIともにインデックスを許可する
対象ページ:インデックスを許可しない
という設定を行ってください。こうすることで、
robots.txt は パターンA
対象ページのみに noindex, nofollow が付与される
という状態になります。
2. サイト全体を検索エンジンには出したくない
サイト設定:生成AIのインデックスは許可するが、検索エンジンのインデックスは許可しない
または
サイト設定:検索エンジン・生成AIともにインデックスを許可しない
という設定を行ってください。こうすることで、
公開対象の全ページに noindex, nofollow が付与される
robots.txt は設定内容に応じて パターンB または パターンC
という状態になります。
まとめ
ページ単位の制御をしたい場合 は、サイト設定を 「検索エンジン・生成AIともにインデックスを許可する」 にします。
サイト全体で検索エンジンへのインデックスを止めたい場合 は、サイト設定で制御します。
サイト全体でインデックスを許可しない設定にした場合は、ページごとの設定よりサイト設定が優先 され、全ページに noindex, nofollow が付きます。
robots.txt の内容は、サイト設定に応じて パターンA / B / C のいずれかになります。