ページを一部リライトしたため、URL検査からSearch Consoleでインデックス登録をリクエストしようとしたところ、「URLがGoogleに登録されていません」と表示されました。
該当のページは特にnoindex設定をしている訳でもなく、また「クロール済み」とも表示されています。
本記事では、下記の内容を記載していきます。
- なぜクロール済みインデックス未登録とされてしまうのかの原因
- クロール済みインデックス未登録ページの一覧確認方法
- どのようなコンテンツがクロールされるものの、インデックスされないという傾向にあるのか
それでは順に、說明をしていきます。
目次
URL検査を行うと、「URLがGoogleに登録されていません」と表示される
"このページはインデックスに登録されていませんが、エラーではありません。"と表示され、Search Consoleのカバレッジステータスとしては "クロール済み インデックス未登録" となっています。
検出データも下記のようになっており、サイト上に問題があるようには思えません。
- サイトマップ: ~/sitemap.xmlと ~/sitemap_index.xmlのXMLサイトマップが無事に検出
- 参照元ページ: 自サイト内のページを参照元とされ、クローラに辿られている
- 前回のクロール: 約1ヶ月前の日付が記載されており、無事にクローラにクロールされている
- クロールを許可?: はい
- ページを取得: 成功
- インデックス登録を許可?: はい
- ユーザーが指定した正規URL: ページ公開時に指定したURLと一致している
- Googleが選択した正規URL: 検査対象のURLとされ、URL検査で指定したURLが正規URLとしてGoogleにも認識されている
もし上記のうち、たとえばインデックス登録を許可?がいいえになっていたり(noindex)、クロールを許可?がいいえになっている場合(robotをブロック)などはページのmeta設定等に原因がある可能性があります。
また、上記以外でもクロスドメインによる重複コンテンツとして認識されていたり、閲覧時にcookieを要求するページの場合にはインデックスされないようです。
Google Search Consoleでサイトマップ登録してもインデックスされない / インデックスが減る | SEOツール アレグロマーケティング
私の本ケースの場合、ページに原因がある訳ではないが、Google側の判断で本ページをインデックスしていない状況が疑われました。
実際に検索ボックスで" site:該当のURL "で検索してみると、確かに検索結果に出てきません。インデックスされていないようです。
Google 検索で自分のページが見つからない場合 Search Console ヘルプ
他にもクロール済みなのにインデックスされていないページがあるか一覧確認
次に、同様にクロール済みなのにインデックスされていないページがあるか、一覧を確認します。
下の箇所からクロール済でインデックスされていないページの一覧を確認できます。
左メニュー インデックス > カバレッジ > 除外にチェック > クロール済 インデックス未登録をクリック
ものすごい数が「クロール済みインデックス未登録」とされていました…!
中身を見てみると、インデックス未登録のページはほとんどが /feedというRSS出力用ページ。/feedページはクロールさせても問題はないようですが、特に評価してほしいページでもありません。
あまりにも数が多いため、/feedにはnoindexを追加するようにします。該当のサイトはWordPressで運用しており、下記の記事を参考にnoindexを設置しました。
サチコのカバレッジでfeedがインデックス未登録として大量に出現 | スマコマ
その他にはアーカイブページの2ページ目以降や、システム上生成されるページなどがインデックス未登録とされていました。 これはWordPressにおいてSEOプラグインがテーマと競合したため効いておらず、noindexを設置したいページに設置されていないことが原因でした。
上記以外に5ページほど、通常のブログ記事もインデックス未登録として処理されていたようです。
何の設定不備もないのにインデックスされない場合、Googleに「低品質ページ」と認識されている可能性大
「インデックスする価値がない」低品質ページと判断されている
上記の場合、ページに原因がある訳ではないが、Google側の判断で本ページをインデックスしていない = Googleに低品質ページとして判断されている可能性が大きいです。そのため、"インデックスする価値がない"と判断されているのです。
「クロール済み-インデックス未登録」になる理由は、取得したURLをGooglebotがクロールしたけれど、インデックスする価値は無いと判断され現在はデータベースに登録されないページと考えてほぼ間違いありません。
Search consoleのクロール済み-インデックス未登録の対処法 | SEO対策でホームページの集客を最大化!Find content
私の場合、数としては5ページ、全体からみてもおよそ5%といえる程度でした。この比率が大きくなると、サイト全体として低品質なサイトとして見なされる場合があります。
インデックスされていないページは本当に「低品質」なのか?
しかしこのインデックスされていないページ、本当の意味で低品質だと言えるのでしょうか?
たとえば私のインデックスされていない5ページについて、6,000文字を超えるページや、画像つきで詳細に解説しているページもあります。それらのページのみを見る限り、比較的丁寧にまとめてあり低品質な内容だとは思えません。(手前味噌ですが)
クロール済みだがインデックスされていないページ内容の傾向としては、下記の傾向が見てとれました。
- 書評など、何かをベースにした2次情報としてのコンテンツ
- 引用部分や他サイトとの重複が多く、オリジナル性が乏しいコンテンツ(まとめ記事など)
もちろん、上記パターンの全てがインデックスされないという訳ではありません。しかし、傾向としては上記のものが見られました。
基本的には、コンテンツの内容に「オリジナリティがあるか」で判断されている印象を受けます。
またここからは推測になりますが、たとえば訪問者のページ滞在時間や離脱率なども評価基準となっている可能性があります。この点、Googleは公式見解ではGoogle Analyticsなどで計測されるようなデータはランキング要因にはしていない、と述べています。
しかし過去にも実際にはランキング要因としない要因を計測対象としていた、ということがあったようですので、このあたりも念頭に置いておいても良いでしょう。
クロール済みインデックス未登録のページは「オリジナリティ」の観点から見直してみる
詰まるところ、「ユーザーのためになるコンテンツ」ということに凝縮されますね。ただ本ケースのようにインデックスされない場合には特に「オリジナリティ」の観点から見直してみることが良いでしょう。
そのうえでユーザーが途中で離脱するような分かりにくい内容・設計になっていないかチェックし直すことをオススメします。
コンテンツを変更・リライトしたらSearch ConsoleのURL検査から「インデックス登録をリクエスト」することを忘れないようにしましょう。
Leave a Reply