サーチコンソールのインデックスカバレッジレポートに、「送信されたURLはソフト404エラーのようです」というエラーメッセージが表示されていませんか。
または、除外URLの一覧中に、除外理由としてソフト404と表示されていることがあるかもしれません。
この記事では、ソフト404エラーの内容と原因、対処法を解説します。
インデックスカバレッジレポートについては以下もご覧ください。
参考:インデックスカバレッジレポートの見方とエラーや除外への対処法
ソフト404エラーとは
ソフト404とは、ステータスコードが200のページであるにもかかわらず、Googleからコンテンツがないと判断されており、実質的に404ページと同等なものとして扱われているページのことです。
そのため、Googleはソフト404ページをインデックスしません。
ソフト404ページがあることは、ステータスコードをもとにページの状態を判断するロボットにとっては好ましくない状態です。
ソフト404ページの数が多くなった場合、次のようなリスクを抱えることになるので、可能ならば随時対処しておくことをおすすめします。
・Googleがインデックスすべきページの選定がしづらくなるため、クロール効率の低下を引き起こし、インデックスさせたいページがインデックスされにくくなってしまう可能性がある
・Googleはソフト404であると誤判定を行うことがあり、コンテンツがあるにもかかわらずソフト404扱いになっている場合は、インデックスされないままになってしまう
なお、Googleは機械学習によってソフト404を判定しています。
2021年初頭に、Googleはソフト404をより正確に判定しレポートするようになったことを明らかにしました。
Soft 404 reporting is now more accurate
(訳:ソフト404がより正確にレポートされるようになりました)
Google検索セントラルブログ
これにより、ソフト404と判定されるURLが大きく減少したサイトも見られましたので、確認しておくとよいでしょう。
引き続きソフト404と判定されているURLについては対処を進めていきましょう。
「送信されたURLはソフト404エラーのようです」とは
「送信されたURLはソフト404エラーのようです」とは、該当するURLがサイトマップに記載されている(つまり、インデックスさせたいページであると明示している)にもかかわらず、Googleからソフト404と判定された(つまり、404のようなインデックス不要なページであると判定された)ことを表しています。
対処法は、該当ページがどのようなページであるかによって分かれます。
インデックスさせる必要のないページなのであれば、そのページに404やnoidexなどを明示的に設定し、そのURLをサイトマップから除外します。
インデックスさせたいページなのであれば、コンテンツを追加または修正するなどによりGoogleにインデックスさせるための施策が必要になります。
単に「ソフト404」として除外されているだけでエラーになっていないURLについては、サイトマップには記載されていませんが、やはり対処することをお勧めします。
ソフト404エラーと404エラーの違い
Googleが判定する「ソフト404エラー」とHTTPステータスコードとしての「404エラー」の違いは、次のとおりです。
ページ内のコンテンツ | HTTPステータスコード | |
---|---|---|
ソフト404 | 存在しないと判断されている | 200(OK) |
404エラー | 通常存在しない | 404(Not Found) |
大きな違いはステータスコードです。
404ページは404のステータスコードが返されますが、ソフト404ページは、通常のページと同じように200のステータスコードが返されています。
一方、コンテンツについては、Googleからはソフト404ページは404ページと同等であるとみなされています。
404ページでは「このページは存在しません」などのメッセージが表示され、コンテンツがないことがほとんどです。
ソフト404ページではそのようなページと同等レベルであると判定されています。
ソフト404ページのSEOへの影響
ソフト404に限らず、カバレッジエラーやインデックス除外URLは少数であればさほど大きな影響はありません。
しかし、大規模サイトになるほどエラー数は大きくなる傾向があり、インデックスする価値がないページが増大することにより、今度はインデックスさせるべきページへのクロール効率が悪化する可能性があります。
該当数が多い場合は修正する優先度が高いと言えます。
ソフト404エラーの主な原因
ソフト404エラーが発生する原因はさまざまありますが、該当ページをサイト運営者の視点から大別するとインデックスさせる必要のないページである場合と、インデックスさせたいページの2つに分けられます。
前者なら明示的に404設定されていないのが原因ですし、後者ならばGoogleに、インデックスするに値するページであることを示せていないのが原因です。
本来404にすべきページなのに404設定されていない
本来ステータスコード404を返すべきページなのに、返せていない場合で、最もシンプルなパターンです。
例えば次のようなページは404にすべきと考えられます。
・記事や商品などが存在しない、または削除された詳細ページ
・該当する記事や商品が存在しないカテゴリ(一覧)ページ(※noindexでも可)
・example.com/aaaaaaなどのように存在しないページである
コンテンツの質や量が低い
メインコンテンツが少ないほどページがインデックスされない可能性は高まります。
一般的にそのようなページはいずれかのページの重複であるとみなされたり、単純にインデックスする価値がないとみなされることがほとんどですが、ソフト404と判定されてしまうこともあります。
ページ内のコンテンツを読み込むことができない
JavaScriptを使用している場合などで、メインコンテンツが適切に読み込まれない場合、結果として低品質ページのように見えるためにソフト404となる可能性が考えられます。
Googleが誤判定している
ページ内のコンテンツが豊富なほど誤判定される可能性は下がると考えられますが、ある程度コンテンツがある場合でも誤判定されるケースがあります。
判定には決まった基準があるわけではなく、自動判定されるため、中には誤って判定されることもあるということです。
Googleはソフト404を判定する際にレイアウトやテキストなど様々な要素を参考にしていると考えられます。
特に、エラーページにありがちなテキストを強調表示して使用しているページは誤判定される可能性が高まると考えられます。
具体的には、「存在しません」「見つかりませんでした」「Not Found」「Error」などが該当します。
ソフト404エラーの対処法
まずは、ソフト404エラーがどのページ(URL)で検出されたのかを確認しましょう。サーチコンソールのインデックスカバレッジレポート(メニュー「カバレッジ」)の下段に表示されるエラー項目から、「送信されたURLはソフト404エラーのようです」をクリックします。(または除外の項目から「ソフト404」をクリック)
すると、エラー対象となっているページ(URL)が一覧表示されます。
URLをそれぞれ確認して、前述したどの原因でソフト404と判定されているかを確認しましょう。
それらのURLはインデックスさせる必要があるのか、その必要はないのかを判断します。
その上で、以下のような対処を行います。
インデックスさせる必要のないページがソフト404となっている場合
→インデックスさせないようにするためにステータスコードの変更などを行う
インデックスさせたいページがソフト404となっている場合
→インデックスされるようにするためにページのコンテンツや読み込みの改善を行う
それぞれ詳しく説明します。
ページのHTTPステータスコードを変更する
ページやコンテンツが存在しない場合は、ページ未検出を示す「404 Not Found」や、ページが消滅したことを示す「410 Gone」を設定します。これらを設定することで、ページが存在しないことをGoogleに明示できます。
ページが移動済みの場合は、恒久的な移動を示す301リダイレクトを設定します。
このような設定はWordPressなどCMSを使用している場合は自動的に行ってくれるでしょうが、手動で行う場合はhtaccessを使って行うことが多いでしょう。
たとえば404は以下のように記述します。
ErrorDocument 404 /404.html
404.htmlを適切にアップロードしておけば、ページが存在しなかった場合にステータスコード404とともに404.htmlの内容が表示されます。
ここで、以下のように絶対パスで記載してしまうと最終的に200が返ってしまい、ソフト404の原因となりますので注意が必要です。
ErrorDocument 404 https://example.com/404.html
noindex設定をする
ステータスコードを変更せず200のままにする場合でも、noindexタグによりインデックスさせないことを明示することが可能です。
参考:meta noindexの書き方と使用するシチュエーション
該当する詳細ページが少ない一覧ページや、SPAページなどでは404設定ではなく、noindex設定のほうが適当であったりやりやすかったりする場合もあるでしょう。
canonical設定をする
別の正規ページが存在することを明示したい場合にはcanonical設定を行うことによりソフト404判定を避けることができます。
参考:canonicalタグの書き方と使い方
誤判定のもととなる要素を排除する
インデックスさせたいページなのに誤判定されている場合には、誤判定のもととなる要素の排除するようにしましょう。
404ページにありがちなフォント、レイアウト、テキストは使用されていないでしょうか?
特に前述した「存在しません」「見つかりませんでした」「Not Found」「Error」といったテキストや強調表示を確認してみましょう。
コンテンツの読み込みを改善する
ページ内のコンテンツが適切に読み込まれていないために誤判定されてしまう可能性もあります。
特にメインコンテンツの表示にJavaScriptを用いている場合にはサーチコンソールのURL検査ツールでページの状態の詳細を確認してみましょう。
参考:URL検査ツール(旧:Fetch as Google)とは?初心者でも分かる簡単な使い方
URL検査ツールの結果や、結果画面から実行できる「公開URLのテスト」によって、以下の問題が発生していないか確認してみましょう。
・リソースがrobots.txtでブロックされていて読み込めない
・リソースが多すぎたり大きすぎたりして読み込みに非常に時間がかかっている
・ツールに表示されるスクリーンショットに特定のコンテンツが表示されない
ページ内のコンテンツを拡充する
リソースの読み込みに問題がない場合は、コンテンツのオリジナル性が乏しいことにより「ソフト404エラー」と判断されている可能性が高いです。
インデックスさせたいのであればページ内のコンテンツを改善してオリジナル要素を増やしましょう。
ソフト404対応後はサイトマップもチェック
「送信されたURLはソフト404エラーのようです」に該当していたURLを404やnoindex設定するなどしてインデックスさせないようにした場合には、該当のURLをサイトマップから除外するようにしましょう。
そうしないと今度は「送信された URL が見つかりませんでした(404)」などのエラーが出てしまいます。
インデックスさせるための施策を行ったページはそのままサイトマップに残しておきます。
まとめ
ソフト404エラーは数が少ないうちは大きな問題になりませんが、数が多くなるとGoogleのクロールやインデックス効率を悪化させるおそれがあります。
サイトの規模が大きくなるほどカバレッジエラーには敏感になっておくことをおすすめします。