ホームページやブログを運営していれば、 検索エンジンについて思いをいたさざるを得ないでしょう。 中にも現在ではYahoo!に検索エンジンを提供しているため寡占的状況にある Googleについて何も知らないままと言う訳にはいきません。 そのGoogle自らが、Google検索エンジンについての情報の縁となるWebサービスを Webマスターツール と言う名前で提供しています。 従ってホームページやブログ運営には必須のサービスとなっているのは言う迄もありません。
Webマスターツールとは
Googleが無料で提供するサービスは大抵が インターネットの使い勝手を向上しインターネットユーザー数の引き上げを狙って提供されており、 Webマスターツールもその一つです。 なんとなればインターネットユーザーの増加こそが企業としてのGoogle社の利益に繋がるからです。 即ち、Googleとしてはこのツールでそれぞれが運営する ホームページやブログを効果的なものとし、 それに依って運営者及び閲覧者の満足を得たい訳です。
Googleは検索エンジン提供に為にインターネット上の膨大な情報を クローラー というプログラムで収集しています。 このクローラーに収集されてこそ運営するWebサイトは検索結果に表示されるのでした。 この収集した情報がGoogleに分析されて評価されるのですが、 どの様な評価を受けているかの概要がWebマスターツールを通して運営者に開示されるのです。
クロールエラー
Googleの検索エンジンはホームページやブログへの読者流入の大きなチャネルですから、 運営者は効果的に利用することでアクセス向上が望めると言う寸法です。 そのためにWebマスターツールには様々な検索エンジンに関連した機能が搭載されています。
その一つが クロールエラー 情報です。 Googleアカウントでログインしたらメニューの 健全性 の直下に用意されています。 実際に本ブログ、 はまぞうランクチェック! のデータを見てみたものが下の図です。クロールエラーには以下の3種類が有ります。
- サーバーエラー
- アクセスが拒否されました
- 見つかりませんでした
上の図はその内の 見つかりませんでした を選択したものです。 これは所謂404エラーに相当し、Googleが収集したURLの内、 運営サイトのドメインに属するものにクロールした際に ページが存在しない旨のエラーコードをGoogleに返したものです。
従ってちょうど本ブログが利用するブログシステム はまぞう が先月は2012年9月27日から丸2日間もの長期に渡ってリニューアルで そのシステムを止めた影響が色濃く表れるものとなりました。 図内に赤矢印で指した期日のリニューアル開始日を潮に 見つからないページ数が急増しグラフが飛び跳ねるように起き上がっています。
勿論これは好ましい状態ではありませんから 運営側には肝に命じて欲しい訳ですが、 若しブログシステムを借りずに自ら運営しているならば この如きグラフが提示されれば非常な問題ですので急ぎ対応が必要となると言う寸法です。
インデックスステータス
このように様々な重要なサイト運用の為の情報がWebマスターツールからは齎されますが、 此の度、新機能が追加されました。 この新機能の名前は インデックスステータス と呼ばれGoogleウェブマスター向け公式ブログの2012年8月31日の記事 インデックス ステータス機能で Google 検索のインデックスの秘密が明らかに! でもアナウンスされています。
インデックスステータス基本情報
その機能はクロールエラーと同じく 健全性 の直下に用意されています。 此方も本ブログのデータを見てみましょう、下の図がそれです。
これが本ブログの基本情報で1年間に渡る インデックスに登録されたページの総数 の推移がグラフ化されています。
クローラーが収集した情報が処理して登録されることを インデックス される、と言います。 インデックスされてこそ検索結果にも表示される訳です。 従って例えばブログ記事を継続的に投稿しているならば それに連れてこの折れ線グラフは右肩上がりにならなければなりません。
本ブログの場合は大方、投稿数に連れてインデックスされる数も増えており、 去年年末から今年年頭に頑張って更新したものの、 最近では余り投稿も無く横這いになっていると言うその傾向も確りと反映されているようです。
インデックスステータス詳細情報
しかし1点気になるのは別に記事の削除等はしていないにも関わらず、 今年2012年3月に一旦インデックス数を落としている部分です。
インデックスステータスは基本情報のみならず、 アクティブになっている基本ボタンの右の 詳細 ボタンをクリックすれば詳細情報も見られます。 実際に表示してみたものが下の図です。
折れ線のパラメータが2つ増え、以下の3つになりました。
- インデックスに登録されたページの総数
- 未選択
- ロボットによりブロック済み
グラフを見ればインデックス数の減った分は 未選択 に奪われているのは明白です。 この未選択と言うバラメータはGoogleに以下のように説明されています。
サイト内で他のページにリダイレクトする URL、 またはコンテンツが実質的に他のページに類似している URL です。
即ち、頃日SEO業界を賑わしている パンダアップデート で言う処の 重複コンテンツ と見做される類のもので余り好ましい状況ではないようです。
インデックスステータス更に詳細情報
パラメータは実は未だ用意が有り、 全部で以下にリストアップする5つになります。
- インデックスに登録されたページの総数
- クロール済み
- 未選択
- ロボットによりブロック済み
- 削除済み
表示されていないものはチェックボックスにチェックを入れ、 赤い更新ボタンをクリックすれば閲覧可能となります。 実際に表示してみたものが下の図です。
このグラフを見れば取敢えず全てクローラーが収集したものの、 分析の結果、重複等により幾分かはインデックスするに相応しくないものであり、 未選択として除かれた、と言うGoogleの対応が明らかになります。
運営者としては何も積極的なアクションは起こしていませんから、 3月の時点でブログシステムが何某かの出力変更をした、 若しくはGoogleが分析アルゴリズムを変更した、 の孰れかが相当するのでしょう。
未選択への対応の実際
独自でシステムを運営したり、または貸与システムでも該当部分に手を入れることが可能であったりするならば、 この未選択を減らすべき方向で検討した方が良いかも知れません。 但しどうしたら良いか迄はWebマスターツールは教えてくれませんので なかなか悩ましい処ではあります。 下手をして手塩に掛けた重要なコンテンツを消してしまうなど無いよう、 対応の際はくれぐれも注意しましょう。
本ブログではありませんが、実際に未選択を減らすべく対応を別サイトで取ってみました。 下の図にその前後の経緯を表すデータを表示します。
今年2012年4月から順次増え始めた記事がクローラー済み数、 インデックス数を共に右肩上がりに押し上げて行きます。 しかし全体数が増えるに連れ、徐々にクローラー数が インデックス数の倍程にもカウントされているのが明らかになってきました。 Googleが半分は重複コンテンツであるとして未選択に分類していた訳です。
この状況と他のWebマスターツールデータ( HTMLの改善 )などからPC向けと携帯向けに同じコンテンツをURLを変えて応答しているのが問題であると判断しました。 そこでrobot.txtに修正を加え、携帯向けURLは無視するように記述しました。 その作業を行って程無く結果が出た部分をグラフ上ハイライトにしてあります。 どうやら効果は覿面であったようです。
今回は新機能のインデックスステータスを中心に記事を起こしましたが、 他にも未だ役立つ機能が用意されています。 矢張りWebマスターツールはWebサイト運営には現時点では必須でしょう。