サイトを運営しているとどうしても作られてしまうのが「重複コンテンツ」です。重複コンテンツとは、異なるURLにもかかわらず内容が全く一緒、もしくは似通っているページ同士のことを指します。
例えば、wwwのあり、なしだったり、httpとhttpsの違いなども重複コンテンツに含まれます。

 

もちろん悪意を持って使用することは良くないですが、通常であれば重複コンテンツが原因で評価が下がってしまったり、ペナルティを受けてしまうことはありません。だからと言ってそのままにしておくのも良い状態とは言えないでしょう。

 

なぜそのままにしておくのは良くないのでしょうか?
また、その場合はどうしたら良いのでしょうか?

なぜ重複コンテンツが良くないのか

Googleのクローラーはサイトをインデックスする時に各ページの内容を見て回ります。その時、同じ内容を扱っているとみられるページを複数見つけた場合には、最も完成度が高く有用だと判断したページを「正規のページ」として扱います。

 

この「正規のページ」はクロールの頻度が高くなり、その代わりに正規ではない重複ページとして認識されたページのクロール頻度は低くなっていきます。すると、重複しているとみなされたページはクローラーが来なくなっていき、やがてインデックスが消えてなくなることも……あるかもしれません。

 

もし、Googleが重複しているとみなしたページが一生懸命作った大切なページだとしたら、努力して作ったページがインデックスされないことになります。

 

このように、どのページが本当の「正規のページ」なのかをGoogleに知らせないと、本当にインデックスして欲しいページが検索結果に表示されなくなってしまう、という最悪の事態を招きかねないのです。

 

これが、重複コンテンツが良くない理由の一つとして挙げられます。もっとも、同じコンテンツなのにURLが違うとユーザーも混乱してしまうかもしれませんし、URLが複数あるがゆえに、どのページにもリンクが張られてしまい評価も分散する可能性があります。

このように、様々な理由により重複コンテンツへの対応が必要となります。

では一体どう対応したらいいのか

正しい「正規のページ」をGoogleに知らせるためには、下記のような方法を取ることが出来ます。

 

 

もちろんどの方法にもメリットとデメリットがあるため、場合によって使い分ける必要があります。また、詳しい方法やその他に紹介されている方法に関しては、Googleのヘルプページを参考にしてみてください。

 

重複コンテンツに関するヘルプページ

https://support.google.com/webmasters/answer/139066?hl=ja

 

サイトのコンテンツを効率よく正しくGoogleに知らせるために、重複コンテンツは正規化することをおすすめします。