将棋の神様〜0と1の世界〜

「三間飛車のひとくちメモ」管理人、兼「フラ盤」&「チェスクロイド」作者がおくる、将棋コラム

検索動機解析を利用したパーソナライズ検索の質向上について

Microsoftの検索結果にWikipediaの記事が統合される日がくるらしい

2008/08/20のエントリー「いつかKnolがWikipediaを殺す、かも」の続き。
本題の前に補足事項を。上記エントリーにて、

Googleは、これまでのテキスト検索結果だけでなく、画像や動画の検索結果も含め(Youtube検索結果はすでに入っている)、直感的にわかりやすいユーザビリティを保ったまま「一括」表示しようとテストを続けている。いずれこの中にKnolも入ってくるに違いない。

と述べたわけだけど、ちょうどタイミングよく、本日こんなニュース記事があった。


「将来、Microsoftの検索結果とWikipediaの記事の統合を目にすることになるだろう」(Nadella氏)

Microsoftの検索サービスにWikipediaの記事が載る日がいずれくるようだ。これはWikipediaにとってとてもいいニュース。だが、土台となるMicrosoftの日本語キーワード検索技術がひどすぎる。現状利用している日本人はほとんどいないのではないだろうか。

「What is "keyword"?」から「How about "Keyword"?」への動機の遷移を利用

閑話休題
パーソナライズ検索においては、過去にそのユーザーの検索履歴(サイト訪問履歴まで収集されている場合も)がわかっているので、上述の2008/08/20のエントリーで概要を述べた通り、一度検索されたキーワードは、2回目以降は「How about "Keyword"?」で検索されていると考えて、ほぼよい。したがって、「What〜」動機で参照されるべきページのページランクを低めに評価し、検索結果を表示するようにする。

「ほぼ」といったのは、厳密にはそうは言えないからで、難解な専門用語や英単語などは意味を何度も何度も繰り返し調べてしまう、すなわち「What is "keyword"?」動機で同キーワード検索を繰り返してしまう経験が誰にでもあると思う。
この要素は判断が難しい。エンタメ系分野のキーワードとそれ以外の分野のキーワードとで、「何度目で「How about "Keyword"?」動機への移行と判断するか」のパラメータを変えてやる、などの工夫が必要か。前者は2度も「What is "keyword"?」動機で調べることはないだろう。

「What is "keyword"?」系ページか「How about "Keyword"?」系ページかの判断

根本的な話なのだが、これが難しい。「Wikipedia」は「What 〜」系、と手作業でマッチングしていてはきりがないので、自動化しなくてはならない。素人の私には見当がつきません。膨大な実績を持つGoogle検索の「中の人」達なら簡単に思いつくのだろうけど。
参考:

現状のGoogleは、まだパーソナライズ検索にそれほど独自性を入れてはいないようだ。


Googleの検索品質の責任者であるUdi Manber氏は2008年初め、検索結果の表示順に対するパーソナライゼーションの影響はごくわずかだと述べた。

いずれ本稿で述べたような要素を用いたパーソナライズ検索を行なうのではないかと思う。
ちなみに今実際に行なわれている動機解析として有名なものは、「あいまい語解析」(過去の検索履歴から、例えば検索キーワード「アップル」が、「りんご」または「コンピュータ」どちらの意図で検索されているかを検索履歴から判断する)くらいだろうか。

・・・以上で終わり。書き終えて気付いたが、内容が無く、尻切れになってしまったm(_ _)m。

参考・・・著名ソーシャルメディアにおけるアルゴリズム

アメリカのメジャーなソーシャルニュースサイトなどのランキングアルゴリズムが下記に紹介されている。意外にシンプル。興味深い。

2008年12月追記

本説明でいう「How about "Keyword"?」のことを、「ナビゲーションクエリ」と呼ぶらしい。不覚にも知らなかった。


このような行き先が一つに決まっているクエリのことを「ナビゲーショナルクエリ」と呼ぶそうだ。例えばサイトの名前、団体名、企業名などである。このようなクエリには、そのキーワードを冠したサイトに行きたいという、ユーザーのニーズがはっきりと現れている。