Webサイトのコンテンツのなかには、検索エンジンに評価されることが適さないページもあります。そのようなページを放置していると、サイト全体の評価を下げることになりかねません。
そこで、検索エンジンにインデックスさせないための施策の一つが「noindex」タグの設置です。
この記事では、noindexタグの仕組みや使い方、設置時の注意点などを解説します。また、似たような働きをする「robots.txt」や「nofollow」タグ、「noarchive」タグについても、SEO効果の観点から適切な使い方を紹介します。
noindexタグとは?
noindexタグは、検索エンジンに特定のページをインデックスさせないために使用するmetaタグの一つです。情報量が少ないなど、Webサイト上の品質の低いページにnoindexタグを設置することで、検索結果への表示を回避できます。
なお、noindexタグは低品質のページ以外にも使えます。使用すべきケースについては、のちほど詳しく説明します。
noindexタグの仕組み
noindexタグの仕組みを知る前に、Googleなどの検索エンジンが、どのようにしてサイトを評価しているか説明します。
検索エンジンがWebページを認識して評価するまでには、大まかにいえば以下の3つの段階があります。
- クロール(検索エンジンのソフトウェアがインターネットを巡回し、Webページの内容を収集・保存する)
- インデックス(検索エンジンのデータベースに、Webページが登録される)
- ランキング(検索エンジンがユーザーの検索キーワードを解析し、関連性のあるWebサイトを順に表示する)
さらにいえば、クロールとインデックスの間には「レンダリング」という作業があります。レンダリングとは、HTMLやCSSなどで書かれたコードを、Webページとして閲覧できる形に整える仕組みのことです。
noindexタグを設置すると、このレンダリングが行われなくなるため、後続の処理までいかず、インデックス処理が走らないことになります。
なお、noindexが設置されたページについても、頻度は下がりますが検索エンジンのクロール自体は行なわれます。そのためnoindexタグは、インデックスさせないために利用するものと覚えておきましょう。
robots.txtとの違い
noindexタグと似た働きをするものに、robots.txtがあります。
robots.txtは、クローラーの動きをコントロールするためのテキストファイルです。サイト内のディレクトリやページに対し、クロールするかどうかを指示する際に用います。最上位のディレクトリにrobots.txtを配置しておくと、サイト内のクローリングを最適化できます。
なお、インデックスしたくないページをrobots.txtでブロックするやり方は用途が違うため推奨されません。
また、robots.txtとnoindexを併用することも推奨されません。robots.txtでクロールを拒否したURLにはクローラがいかないため、基本的にはnoindexタグを発見することもありません。
nofollowタグとの違い
nofollowタグとは、検索エンジンのクローラーが、リンクをたどるのを防ぐためのmetaタグです。例えば、自社サイトとは無関係なページへのリンクや信頼できないサイトへのリンク、広告リンクなどに設定します。
nofollow は当初、リンク先をたどらせないという「命令」を出す属性でしたが、2019年以降は、リンク先をたどらなくてよいという「ヒント」を与える位置付けに変更されています。
nofollowタグの設置には、サイト内のクローリングを最適化する効果があります。ただし、あるページではnofollow設定がされていても、ほかのページでnofollow設定がされていないリンクがあると、そのリンクはクロールされる可能性があるので注意しましょう。
なお、nofollowはページごとまたはリンクごとに設定が可能です。head内に設置する場合は以下のように記述します。
<meta name=”robots” content=”nofollow”>
リンク要素ごとに設定する場合は、以下のようにaタグの中に記述します。
<a href=”http://example.com” rel=”nofollow”>リンク</a>
また前述のとおり、nofollow が「命令」から「ヒント」に変更されたことで、新たにugcやsponsoredというrel属性が追加されました。ugcはコメントの書き込みなどに使用し、sponsoredは広告など有料リンクに使用します。
このように、nofollowとnoindexはまったく別の働きをする属性のmetaタグです。併用も可能ですが、そもそもnoindexされたページからのリンクはクロールされにくくなります。
参考:外部リンクの rel 属性(nofollow/ugc/sponsored) | Google 検索セントラル
noarchiveとの違い
noarchiveは、検索エンジンにキャッシュを残したくないときに使用します。noarchiveを設置すると、古い情報がキャッシュに残らず閲覧されることもなくなります。
一般ユーザーがキャッシュを参照する機会は少ないものの、見られたくないページについては設定しておくとよいでしょう。例えばECサイトでは、「商品の値段を変更した場合」や「過去のセール情報」などのページで活用できます。
noarchiveタグは、head内で以下のように記述します。
<meta name=”robots” content=”noarchive”>
noindexタグの設置方法
noindexタグを設置する方法は、下記の2つです。サイトおよびコンテンツタイプに合った方法を選びましょう。
HTMLにmetaタグを設置する
設定したいページHTMLファイルのhead内に、以下のmetaタグを設置します。
通常はこの方法で設定するのがよいでしょう。
<meta name=”robots” content=”noindex”>
HTTPレスポンスヘッダーに設置する
動画や画像ファイル、PDFなどHTML形式ではないファイルは、noindexタグを設置できません。その場合、X-Robots-Tag HTTP ヘッダーにnoindexタグを設置します。
HTTP/1.1 200 OK
(…)
X-Robots-Tag: noindex
(…)
設定方法は利用しているサーバーによって異なるため、詳しくはサーバー管理者に確認してください。
ちなみに、WordPressなどを利用している場合は、プラグインで簡単に設置が可能です。
参考:noindex を使用してコンテンツをインデックスから除外する | Google 検索セントラル
noindexタグが設置されているかどうかの確認方法
noindexのmetaタグが設置されているかどうかを確認するためには、HTMLソースを調べます。調べたいページのソースを「Ctrl+U」などで表示させ、「Ctrl+F」で検索窓を開き、「noindex」と検索します。ソース上にnoindexタグが設置されていれば、問題ありません。
ただし、HTTPヘッダーで記載されている場合には、上記の方法では見つけられないため、ChromeのDevツールなどを使用して、HTMLのレスポンスヘッダーを調べます。
また、クロール済みのページであればGoogleサーチコンソールからも確認可能です。「ページ」メニューを開くと、「ページがインデックスに登録されなかった理由」のなかに、「noindex タグによって除外されました」という表示があります。この場所に表示されているのが、インデックスされなかったページです。
noindexタグのSEO効果
検索エンジンがnoindexタグを見つけると、基本的にそのページはインデックスされないため、そのページがないものとして扱われます。
もし自社サイト内に「品質が低い」とみなされる可能性が高いページがあると、サイト全体の評価が下がってしまいますが、インデックスの必要のないページにnoindexタグを設置することでそのリスクを軽減できます。
ただし、「noindexタグを用いるべき低品質のページ」は、「検索流入の少ないページ」とイコールではない点に注意してください。検索流入が少なくても価値の高いページはありますし、このようなページにnoindex処理を行なうと、かえってサイトの評価を下げることになります。
noindexタグを使用するケース
次に、noindexタグの利用が推奨される具体的なケースを紹介します。
不要なページは生成させない
まず前提として、以下の順に考えるべきであることを押さえておいてください。
- 不要なページは生成させない、作成しない
- 生成してしまった場合は、削除する(代替となるページがない場合は、404を返す)
- 何らかの理由で必要ではあるが、検索エンジンから低い評価を受ける可能性のあるページは、noindexまたは「canonical」設定を行なう
ちなみにcanonicalとは、検索エンジンが提供している属性のこと。代表的なものにcanonicalタグがあります。canonical設定のおもな目的は2つあり、「重複するコンテンツURLの正規化」と「分散した被リンクの適正化」です。
詳しくは以下のページを参考にしてください。
参考:【サンプル有】canonicalとは?canonical(カノニカル)タグの書き方・SEO施策における重要性を解説
情報量が少ないページ
情報量が十分でないページは、検索エンジンからの低評価につながりかねません。そのため、noindexタグの設置が有効な場合があります。例えばデータベース型のサイトにおいて、検索結果が0件のページなどは対象と考えられます。
これらのページに対しては、まずその必要性を確認しましょう。不要なページであれば削除します。必要なページの場合は、情報量を増やせないか検討し、難しい場合はnoindexタグを設置するとよいでしょう。
あえてインデックスさせたくないページ
検索ユーザーに見せたくない、積極的に公開したくないページへの設定も有効です。具体的には「お問い合わせありがとうございました」に代表されるサンクスページや、手続きの処理を知らせるページなどが挙げられます。これらはサイトには欠かせないページですが、インデックスされる必要はありません。
また、なかには、テストページや管理画面など、一般ユーザーに「見られては困るページ」もあるでしょう。こういったページはnoindexタグよりも、Basic認証などでアクセス制限を行なうことをおすすめします。
広告のランディングページ
リスティング広告のランディングページは、おもにサイト内のコンテンツを広告用にアレンジして作成されています。そのため検索エンジンからは、「元のコンテンツと内容が重複している」とみなされる可能性があります。
ランディングページを上位表示させたくない場合は、noindexタグを設置すると効果がある場合があります。ただし、ランディングページ自体に価値がないわけではないため、canonicalで正規URLを指定する方法もあります。
このように、リスティング広告とSEOでは実施したい施策の方向性が異なる場合があるため、よく検討してから行なうことが重要です。
配信先のページ
コンテンツを外部配信している場合、配信先のコンテンツが自サイトよりも上位に表示されてしまう場合があります。
これはコンテンツシンジゲーション(コンテンツを複数のメディアやウェブサイトで共有・再配布する手法)で起こる現象で、オリジナルコンテンツの認知度向上や、ターゲット層への効果的なアプローチが期待できる現象です。しかし一方で、「どのコンテンツがオリジナルであるか」を検索エンジンが判断できなくなるリスクも生じます。
そこでGoogleでは、オリジナルコンテンツ以外には、noindex処理を行なうことを推奨しています。
参考:正規化に関する問題の修正 | Google 検索セントラル
noindexタグの注意点
最後に、noindexタグを使用する場合の注意点です。おもに以下の2つに留意してください。
クローラー巡回を阻止するものではない
先にも説明したとおり、noindexタグは、検索エンジンのクロール自体を阻止するものではありません。
クローラーに巡回をさせない指示を出したいときは、robots.txtで対応します。
多用しない
むやみにnoindexタグを使うことはおすすめできません。ユーザーのセッション機会を失ってしまう可能性もあるからです。
noindexタグを使う際には、内容を精査したり情報量を増やしたりするなど、まずはコンテンツの改善ができないかを検討しましょう。
まとめ
noindexタグは、適切に使用することで、サイト全体のSEO評価を上げる効果が期待できます。ただし使い方を間違えると、かえってサイトの評価を下げることもあります。そのため、慎重に検討したうえで用いることが重要です。
以下は「noindexタグを使用すべきか?」を判断するためのフローチャートなので、あわせて活用してください。
1.そのページが必要ですか? NO → ページを削除する
YES ↓
2.そのページをクロールさせたいですか? NO → robots.txtで対応する
YES ↓
3.そのページをインデックスさせたいですか? NO → noindexで対応する
YES ↓
4.ページに含まれる情報を増やすなど、コンテンツの質を改善する
なお、noindexタグの設置は使い方次第でSEO評価に大きく影響するため、判断に迷う場合は、プロに相談することをおすすめします。
サクラサクマーケティング株式会社では、noindex を用いたSEOの最適化も含め、SEOコンサルティングを行なっています。ぜひ一度、サクラサクマーケティングにご相談ください。