Googleカレンダーの日本語検索(形態素解析)の問題

Googleカレンダーの日本語検索(形態素解析)の問題 Googleカレンダーとカレンダーを称してはいますが スケジューラー及びスケジュール共有サービスと言えば少し印象は変わるでしょうか? 本ブログ運営者は備忘録、と言うより日記的に利用しておりまして、 そんな活用も許容してくれる便利な Google社提供のサービスに違いありません。

そんな Googleカレンダーが日本語の検索に於いて全く想定通りの検索結果が返されない、 と言う問題を抱えており、それが解決したのでは、と報じたのが 本ブログ2011年4月2日 Googleカレンダーの検索機能復活 でした。 ところが未だに日本語検索に於いては解決していない問題があるようです。

それは 複合語の検索が出来ない ということです。(2011年6月現在) 例えば本ブログ運営者の利用する Googleカレンダーには関わる 浜松西部ブログ村 がいくつか登録されている筈なのですが、 これで検索しても結果は0件になります。 それではどうするか? この複合語を分割して間をスペースで区切って検索する ことで想定通りの結果が返って来るのです。 下の様になりますね。 浜松 西部 ブログ 村

自然言語(プログラム言語ではなく日本語や英語の様な言葉)に於いて 特に日本語では単語に分割して処理される際、 形態素解析 と称す技術が用いられます。 勿論様々な因果関係が有っての現象でしょうが、 結果だけを見ればこの形態素解析が Googleサーバーでは今上手く動かないからご自分で単語毎に分割してから検索して欲しい、 と言う様な使用法を余儀なくされる状態になってしまっている様です。

この問題は恐らく全世界に展開するGoogle社のグローバルな問題ではなく、 Google日本のローカル問題になるのでしょうが、 是非とも役立つサービスを提供してくれている Google社の日本代表として頑張って欲しいものです。