sitemap.xmlの理解

知らずに使ってなんとかなってるところはある。

どういうものか

雑に言えばサーチコンソールにWEBサイトを登録するために使う。

WEBサイトを作ったときだけでなく、ページを新たに作ったり更新したときにも使う。WEBサイトの最新の状態を検索エンジンに反映させるためのもの、といえばいいのか。

今はあまり見なくなったけど2000年あたりに「サイトマップ」ってページをよく見たけど、あれとは別。人ではなくシステム用に作ったもの。

サイトマップの自作

書式は大して難しくないので自分で打ち込んでもいいけど、WEBサイトを読み込ませたらサイトマップを生成してくれるサービスがある。

XML形式のサイトマップを無料で作成できるツールまとめ | TechAcademyマガジン
SEOにも効果のある「XML形式のサイトマップ」を作成できる無料ツールを紹介する記事です。XMLサイトマップをGoogleなどの検索エンジンに登録することで、ページを正しくクロールしてくれるようになります。

ファイルの上限

サーチコンソールにはサイトマップのファイルは50MBまで、ページ数は50,000個までの上限がある。コーポ―レートサイトなら引っかからないけどECとかブログとか投稿サイトとかは運営すればするほどページ数が増えるもんで、それでも上限に達するかは怪しいものがあるけどそこまで非現実じゃないかなみたいな。

で、天井を迎えたときの対策として、サイトマップの分割がある。

サイトマップの分割

要するにここを読めばいい。

大きなサイトマップまたは複数のサイトマップを管理する | Google 検索セントラル  |  ドキュメント  |  Google Developers
サイトマップ インデックス ファイルを使用することで、複数のサイトマップを一度に送信できます。大きなサイトマップや、複数サイトのサイトマップを管理する方法についてご覧ください。

サイトマップのインデックスを作って複数のサイトマップを紐づける。

自作する機会はあんまりない

CMSやらECサイトやら、一般的なサービスは大概サイトマップを用意してくれてるのでURLを拾って登録するだけの作業になる。なので難しいことはないし、面倒もそんなにない。

だけど難点として、何でもかんでもサイトマップに入れられる場合がある。WPとか、旧式のECCUBEとかそんな感じ。検索避けを入れてるのにサイトマップに入れられると無駄にエラーが出る。エラーなら検索結果には出ないから実害はないけどレポートが不穏になるのでよろしくない。身近なところでは問い合わせフォームの確認画面や完了画面とか、むしろ見せたくないじゃんみたいな。

その辺りをカバーするとなると手を入れなきゃいけないし、自動生成との殴り合いになるようならシステムを編集しなきゃいけないし、めんどくさい。

WordPressだとプラグインを使えばタグ別とか投稿別とかでsitemapに含めるかどうかの設定があるけどテーマ側で検索避けを仕込んでるページがあったりしてサイトマップとケンカすることがある。大変。

登録したらいいってものでもない

最終的にGoogle側の審査に通らなければ有効化されないので、登録しても弾かれるケースはある。前述のような検索避けがあれば当然だし、ページのコンテンツが薄いこともネガティブだったりする。エラー頻発による評価低下はないっぽいのでとりあえず登録してみてダメだったら調整みたいなこともありっちゃあり。

コメント

タイトルとURLをコピーしました