Webマスターツールでブログシステムの404エラーを補正する

本ブログは はまぞう と言う地域ブログシステムを利用しています。 地域向けの地方の弱小ブログシステムということもあってか、 なかなかメジャーブログでは見られない問題も発生します。

はまぞうリニューアル

その地域ブログシステムであるはまぞうブログが先日2012年の8月末にリニューアルを敢行しました。 当初まるまる一日ブログが停止すると言う告知にも困惑しましたが、 予定は未定、リニューアル作業が首尾良く運ばず、 ユーザーは遂にまるまる二日間もの停止を余儀なくされました。

リニューアルが済んだとされた後も様々な問題が山積し、 実は1箇月を経た現在も全ての問題が解決した訳ではなく、 諸所の不具合を騙し騙しユーザーは利用している状態です。

無料の地域ブログと言うことでなかなか優秀な技術者を割り当てたりも出来ないでしょうし、 充分なテストの時間を割くことも適わないのでしょうから致し方ないと言えばそれ迄なのですが、 それでも数万人のユーザーを擁している以上はそれなりの対応が必要とされます。 向後改善が望まれる処でしょう。

クロールエラー

様々な問題中にも先日2012年9月15日、本ブログに Webマスターツールの新機能インデックスステータスを使って見た なる記事をものし、Webマスターツールの新機能を紹介した際に 本ブログをモデルとすることで、 ちょうどリニューアルに大きな問題が出たデータを合わせ記載しました。

スポンサーリンク

それが クロールエラー の問題です。 リニューアルが長時間に渡ってシステムを止めたため、 Googleの検索エンジンロボットがクロールしてページの情報を収集しに来た際に 404 という当該ページが見付からない旨のエラーコードをGoogleロボットに渡してしまったいたのです。

Webマスターツールを用いれば登録したブログについて検索エンジン関連の問題があった際には メッセージを表示するようになっています。 従って上図のように2012年8月28日付けで http://rank.hamazo.tv/: 「見つかりませんでした」というエラーが増えています なる警報を受けてしまっていたのでした。

ブログ自体が長時間に渡り停止しているのですから、 クローラーが巡ってきてもページコンテンツの取得が出来ないのは当たり前で、 検索エンジンには折角データベースに登録されているページがないものとして報告されてしまうのです。 検索エンジンに高い評価を受けているブログほど検索エンジンロボットが頻繁にクロールして来ますから、 人気ブログほど問題は大きいと言えるでしょう。

これを以て直接SEO的にダメージを受ける訳ではないことはGoogle自らの謳う処ですが、 決して良い結果を齎すものでないのは確かです。 404エラーを長期間返し続ければ検索エンジンはこのページをデータベースから削除しもするでしょう。 従って長期に渡る停止はシステム提供者として避けるべきですし、 それが余儀なくされた際はユーザーに不利益を与えることをはっきりと認識すべきです。

逓減するクロールエラー

それでも日進月歩に性能の上がる検索エンジンは 役に立つコンテンツを検索エンジン結果の上位に上げるよう努めますから、 放っておいても徐々にクロールエラーは減って来ます。 タイミングを見計らって再度クロールを繰り返し、 検索エンジンデータベースに登録したページが一旦は見えなくなっていたけれども、 それは一時的な問題であったのを理解し、エラーを解除している訳です。

またWebマスターツールでは問題が解決した際には サイト運営者自らが当該事を検索エンジンに知らせる機能を持っています。

上図のようにクロールエラーの提示されているリストに於いてチェックボックスを選択すれば それが既に修正済みであることを検索エンジンに知らせられると言う塩梅です。 検索エンジン側の判断で再度エラーが表示するとの表記もありますが、 その修正が不適切であるのが判明して返って好都合でもあるでしょう。

下げ止まるクロールエラー

そのようにしてエラーはグラフ上、徐々に減少を示す筈なのですが、 或る時点で減少が停滞することが有ります。 今回のはまぞうブログシステムのリニューアルに於ける不都合が 正しくその問題を惹起しました。 停滞したグラフは下の図になります。

9月の終盤、即ちリニューアルから1箇月以上経っても 問題は内包されたままである訳で、 これが長引けば検索エンジンに対して良い影響が有ろう筈もありません。

クロールエラーの内容

以下に表にしたものが下げ止まったクロールエラーが吐き出しているURLです。 全て404レスポンスコードであり、2012年8月27日、即ちリニューアル時に検出されたものが、 そのまま残った形になっています。

優先度URLレスポンス コード最終検出
1d1900-10.html4042012/8/27
2d1901-02.html4042012/8/27
3d1900-05.html4042012/8/27
4d1900-04.html4042012/8/27
5d1900-11.html4042012/8/27
6d1900-06.html4042012/8/27
7d1900-01.html4042012/8/27
8d1899-12.html4042012/8/27
9d1736-06.html4042012/8/27
10d1736-05.html4042012/8/27
11d1918-10.html4042012/8/27
12d1811-10.html4042012/8/27
13d1735-12.html4042012/8/27
14d1733-08.html4042012/8/27
15d1734-05.html4042012/8/27
16d1733-10.html4042012/8/27
17d1900-02.html4042012/8/27
18d1738-08.html4042012/8/27
19d2012-02_1.html4042012/8/27
20d2317-08.html4042012/8/27
21d1997-03.html4042012/8/27
22d1731-08.html4042012/8/27
23d1725-02.html4042012/8/27
24d1899-11.html4042012/8/27

このエラーURL群には一つの共通した特徴が有ります。 それはdで始まり4桁の数字が続きハイフンで区切られて2桁の数字が続く文字列であると言う部分です。 実はこれははまぞうブログシステムが吐き出すカレンダーのURLなのでした。 最初の4桁は年数を、ハイフンの後の2桁は月を表す数字となっています。 即ち本ブログの今月、2012年9月記事のアーカイブを見るには http://rank.hamazo.tv/d2012-09.html (※) なるURLにアクセスすれば閲覧出来る訳です。

有り得ないカレンダーの年月

その意味でエラーとして吐き出されたURLを見れば明らかに可笑しいのが分かります。 2010年を開始年とする本ブログであるのに、 どうにも1700年代という江戸時代の年月で記事を書いたことになっているのです。 またどれだけ続くブログなのか、2300年代と言うドラえもんの誕生より後の未来の年月まで吐き出されています。

勿論これははまぞうブログがリニューアルで不都合を抱えたまま見切り発車したために 吐き出されたエラー出力であり、そんなURLは存在しません。 しかしインターネットに公開した以上、検索エンジンは粛々とその間違いURLを採取し ブログシステムの不適切なエラーの証拠として保存しているのでした。

充分なテストがなされないまま はまぞうブログシステムがリニューアル終了として公開してしまった その不適切な余波が此処に問題として未だ有るのでした。

互いにリンクするエラーURL

更に拙いことにはこれが互いにリンクをしているのです。 このことはリンクリストに出力されるURLをクリックして エラーの詳細、サイトマップ、リンク元、と並ぶタブの内、 リンク元 をクリックしても確認が出来ます。

単独の浮いたURLであれば検索エンジンならずとも不適切だと判断し易い処です。 しかし例えば1900年の4月と5月がカレンダーとして互いにリンクし、 一連のページとして認識されていますから、これは何某かの問題を抱えていると考えれば、 なかなか排除し難くもあるでしょう。 従ってこのように長期に渡りエラーとして保存されているのだと考えられます。

不適切なURLを削除する

Webマスターツールにはこの有り得ない筈のURLが検索エンジンデータベースに登録されてしまった際に、 削除を依頼出来る機能を有しているのはGoogle社の提供するツールならではです。 その機能は 健全化 の下階層に用意されている URLの削除 です。

この設定画面を開き 新しい削除リクエストを作成 ボタンをクリックすれが下図のように入力エリアが開きますので、 先程の有り得ないURLを入力します。

続行をクリックすれば理由を選択する画面に遷移するので適切な理由を選択の後 リクエストを送信 ボタンをクリックすれば リクエスト済み のURLが追加される仕組みとなっています。

このときWebマスターツールからはヘルプページで 削除要件 として次の孰れかの実行が要求されています。

  • 該当するページが非公開であるのをステータスコード(404及び410)で確認
  • robots.txt ファイルにコンテンツブロックの記述付記
  • コンテンツブロックのメタタグNOINDEX をページに付記

此処では固より存在しないページであり、 全て404がステータスコードとして返されるURLですから、 最初の一条に相当する訳で、無論問題有りません。

ブログシステム提供者にはなるべく この様な手間をユーザーに強いないよう、 留意の上、システムを安定的に運用して欲しいものだと切に思います。

※ 現在では HamaZoランクチェック!Blog は本ブログ( Acenumber Technical Issues )に統一しました。

スポンサーリンク