正規URL の指定を、新しいサブドメインだけ付け忘れていた話
正規URL の指定(canonical というものらしいです)は、このページの本命の URL はこれです、と検索エンジンに伝える指定なのだそうです。同じような中身のページが複数あるときに、どれを基準にするかを教える役目があるみたいです。私はこの指定を、新しく足したサブドメインのページにだけ入れ忘れていて、Google から「重複している」と言われるまでしばらく気づかなかった、という地味な失敗をしました。戒めに残しておきます。
何が起きたか
私のサイトは、機能ごとにサブドメインで分けています。トップのサイトがあって、別の入口でいくつかの道具やページ群を動かしている、という形です。あるとき、新しい種類のページ群を一つのサブドメインとして足しました。
しばらくして、Google の管理画面(表示回数やクリック、インデックスの状態を見られるもの)から「重複しています。ユーザーにより、正規ページとして選択されていません」という通知が来ました。最初は何のことか分からなかったのですが、調べていくと、その新しく足したサブドメインのページにだけ、正規URL の指定がまるごと入っていないことが分かりました。先に作っていた他のサブドメインには、ちゃんと指定が入っていたのに、新しいところだけ抜けていたのです。
正規URL の指定が無いと、検索エンジンは「似た中身のページのうち、どれが本命か」を自分で推測することになるらしく、その推測がこちらの意図とずれると「重複」と判断されてしまうようでした。
自分で確認してみた
通知を受けて、サブドメインごとにページを実際に取得して、正規URL の指定が入っているかを一つずつ見比べてみました。すると、はっきり差が出ました。古いサブドメインは全部入っているのに、新しいサブドメインだけ、多くのページで指定が空っぽでした。
調べる中で気づいたこともありました。新しいサブドメインの中にも、別のサブドメインにほぼ同じ内容の「本家」ページがあるものがいくつかあって、それらはあえてその本家を正規URL に指定していました。これは間違いではなく、内容が重複しているときに「こっちが本命です」と正しく伝えている使い方なのだそうです。つまり「指定を付け忘れている」のと「わざと別のページを本命に指定している」のは別物で、ごっちゃにしないほうがいい、と分かりました。
直し方
やったことはシンプルでした。指定が抜けていたページに、それぞれ「自分自身の URL を正規URL にする」指定を一括で入れて、サイトに反映し直しました。すでに正しく入っているページには触らないようにしました。
直したからといってすぐに結果が変わるわけではありませんでした。Google の管理画面で「重複」と言われていた URL の数が減っていくのを、しばらく日をおいて眺める、という感じでした。途中で「修正したので確認してほしい」とお願いする操作もして、反映されるまではのんびり待ちました。すぐには変わらないので「直っていないのでは」と何度か不安になりましたが、前にクロールした結果が残っている間は古い状態が記録されたままになるらしく、焦らないのが正解だったみたいです。
いま採っている方針
この一件のあと、正規URL まわりの方針をはっきりさせました。各ページは原則として「自分自身の URL」を正規URL に指定する。別のサブドメインにほぼ同じ本家ページがあるときだけ、あえてその本家を指定する。そして何より、新しいサブドメインやページ群を足すときは、正規URL の指定が入っているかを立ち上げ時の必須チェックにする、というところです。今回は、先に作ったところには入っていたぶん、「新しいところも当然入っているだろう」と思い込んでいたのが盲点でした。
ついでに、末尾にスラッシュを付けるか、www を付けるか、https の表記やパラメータの有無といった細かい URL の揺れも、指定の中でそろえるようにしました。末尾のスラッシュがあるかないかだけで別の URL として扱われることがあるらしく、サイト全体のルールに合わせておくほうが安心でした。
確認のやり方
新しいテンプレートを作ったときや構造を変えたときは、代表的な数ページを実際に取得して、入っている正規URL を自分の目で見る。サブドメインごとに「全ページに指定が入っているか」をまとめて見比べる。サイトマップに載っている URL と、各ページが指定している正規URL が食い違っていないかを見る。だいたいこの三つを回すようにしています。特に「サブドメイン同士を並べて見比べる」のが、今回みたいな”片方だけ抜けている”取りこぼしを見つけるのに効きました。
教訓
正規URL の指定は、派手ではないけれど効き目のある仕組みでした。とくに、複数のサブドメインや似たページを持っていると、「全部に入っているか」「本命の指定が意図どおりか」が、そのまま検索での見え方に響いてきます。
新しい入口を足したときほど、既存と同じ設定がちゃんと引き継がれているかを疑う。検索からの流入が動いたときは、中身や外の要因だけでなく、正規URL のような土台の設定も確認する。この二つが、今回の失敗以来のクセになりました。アクセスの数字だけ見ていると原因の切り分けが難しいので、主要な設定を時々見直しておく価値はあるなあ、としみじみ思っています。
← 他の制作記を見る | トップ | お問い合わせ