SEO対策で[index.html]の正規化は必要なのか?
- 2022.01.13
- 風俗SEO

結論としましては、[index.html]有無を明示的に正規化しなくても、現在のGoogle検索においてはほとんどの場合は自動的に正規化してくれます。
Googleは[index.html]を必要なしと判断する
例えば下記2つのURLにアクセスできたとします。
- https://example.com/
- https://example.com/index.html
一般的なサイトでは、[index.html]の有無に関わらず同じページを表示します。
多くのサイトでは重複コンテンツを避けるために、[index.html]の有無を正規化しています。
GoogleのJohn Mueller(ジョン・ミューラー)氏によると、Googleが[index.html]が付いたURLを発見した際は自動的に[index.html]を取り除いて [/](スラッシュ)で終わるURLとして処理するとのことです。
この処理はインデックス処理の早い段階で行われます。
[index.html]の有無を正規化するために利用される、下記のようなシグナルが処理されるよりも前の段階で行われます。
- rel=”canonical”
- sitemap
- リダイレクト
ですので、こうしたサイト側からの正規化シグナルがなくても、自動でGoogleは[index.html]無しに正規化してくれるとのことです。
とは言え、rel=”canonical”やリダイレクトの設定で正規化しておくことは悪いことではありません。
Googleに同じURLであることを明確に伝えることができます。
ただ、昔ほど敏感に[index.html]有無による重複コンテンツの心配をしなくても大丈夫ということです。
パラメータ[?]も削除して正規化する場合も
ミューラー氏は次のような質問に対する回答の追加説明を行った。
パラメータの[?](クエスチョンマーク)だけがあるURLは、無い URLとは異なるURLとして扱われる?
https://example.com/
https://example.com/?
システムの都合上、パラメータ付きのURLをリダイレクトした際に[?]だけが残ったままに質問者のサイトではなってしまい、悪影響が検索に対してあるのではと心配しました。
ミューラー氏は正直、Google検索において [?]だけが残ったままのURLと無いURLを同一URLとして見なすかどうかわからないとのことです。
ただ、[index.html]の場合と同様にパラメータを削除したURLに自動的に正規化する場合もあるだろうとのことです。
ページのコンテンツにパラメータを削除しても変化がないURLであれば自動で正規化してくれるはずです。
例えば、アクセス解析用のトラッキングパラメータが付いたURLが該当します。
https://example.com/?utm_source=newsletter&utm_medium=email&utm_campaign=christmas-sale
ただし、コンテンツがパラメータによって変化するURLは多くの場合自動では正規化されません。
例えば、ページネーションをパラメータで構成するサイトです。
https://example.com/article?page=2
このようなURLのパラメータを取り除いてしまうのは、内容が異なるページを同一扱いすることになるので不適切で自動では正規化されません。
※類似しているとGoogleが判断した際は勝手に正規化されると考えられます
まとめ
今回ご紹介した[index.html]の正規化に関してまとめると以下のようになります。
- [index.html]有無は、正規化を明示的に設定しなくても現在はGoogleが自動的に処理してくれる
- ただし、明確なシグナルをGoogleに送れるので正規化設定しておくのは悪いことではない
- 一部のパラメータ付きURLの場合も正規化設定なしでもGoogleが自動処理してくれる
注意しなければならないのは、あくまでも「Googleは」という点です。
Google以外の検索エンジンに関してはこれに限った話ではありませんので、他の検索エンジンにも対応するために、正規化しておくことが無難でしょう。
RELATED ARTICLE
関連記事
LATEST ARTICLE
最新記事