【 ここから本文 】
ソフトウェア&サービス
ソーシャルブックマークに登録 :
印刷用ページの表示
検索テクノロジーの未来を探る
Google、Yahoo!、MSN、goo……次世代の高機能検索エンジンで、どのようなサービスが実現するのか?
(2005年08月15日)
次世代検索エンジンを支えるテクノロジー
ここでは、先に述べたダイソン氏が指し示した方向性などとも対応づけながら、次世代の検索テクノロジーに関するサービスや技術の動向について具体的に解説する。
1. Personalizationを実現するための技術
ユーザー属性を活用する「Personalization」技術の実用例としては、Google Labsの「Personalized Web Search」がある。これは、ユーザーがあらかじめ登録しておいた興味/嗜好を検索結果に反映させるものだ。スライド・バーを用いて、検索結果にユーザーの興味/嗜好を反映させる度合いを調整することも可能で、調整を加えると、瞬時に結果の表示順序が入れ替わる。
また、個人の趣味/嗜好に合わせて、情報を自由にクリッピングしたり、ウォッチしておきたいブログ・サイトのRSSコンテンツなどを収集・表示したりするものも登場してきた。「My Yahoo!」や、gooラボの「ウェブページパーソナライズ高度化実験(パーソナルサマリ)」などがそうである。
例えば、パーソナルサマリは、自分好みのコンテンツを自由に配置して閲覧したいというユーザーの要望にこたえるため、Webブラウザ上で簡単にコンテンツをドラッグ&ドロップによって配置できるなど、カスタマイズをより容易にしている。
2. Filtering By Social Connectionsの新たな動き
ダイソン氏のリポートで提示された「Filtering By Social Connections」は、ネットワークの近い人どうしは類似した情報を好むであろうという仮説に基づいて、情報のフィルタリングやランキングを行う技術であるが、新たに、情報の信憑性や第三者の評価から、ある情報に対するインターネット上での関心の度合いを求め、それを客観的指標の1つとして活用するものも現れている。
そのわかりやすい利用シーンは、飲食店情報の検索である。飲食店に関する情報を掲載したWebページには、その飲食店の公式サイトやグルメ紹介サイトのほか、個人サイトや掲示板、ブログなど、書き手も目的も異なるさまざまなものがある。その中から本当に参考になる情報を探し出すには、検索の際に、掲載情報の信憑性や第三者の評価といった点を考慮することのできる技術が必要となる。gooラボの「店舗情報検索エージェント実験 グルメ版」(東京大学との産学連携プロジェクト)では、任意の店舗について、“記述・説明があるWebページの数が多い”、“該当店舗に関する情報量が多い”といった客観的事実に従い、独自の評価基準に基づくポイントを付与することで、Webサイト上の“有名度”、すなわち目的の店舗に対するインターネット上での関心の度合いを、客観的指標の1つとして活用している。
3. Geography-Specific Resultsの実現例
検索結果と地理情報の連動のポイントは、ユーザーに対して、いかに地図と密接に連係した情報を提示できるかにあり、ここでは、高度な地図インタフェース技術が必要になる。Google Labsの「Google Maps」は、目的地までのルート表示、地域情報検索エンジン「Google Local」のローカル・サーチ機能と連動した近隣情報表示といった従来の地図サービスに加え、米国の地図のような、巨大な地図自体をドラッグできる技術を実装している。これにより、地図を拡大/縮小することはもとより、マウスで左右にドラッグすることで、自由に地図の中を行き来するようなことも行える。
検索結果と地理情報の連動においては、情報の網羅性も重要となる。検索結果が地域に密着すればするほど、ユーザーにとって身近でリアルな生活情報になるため、検索結果に対する情報の過不足が、より際立つことになる。これは、グルメ、飲食店の情報などにおいて、より顕著となる。従来は、ポータルが保持していたデータベースや、提携するコンテンツ・プロバイダーからの情報を検索結果として提示するものが多かったが、インターネット上の情報を検索エンジンがクロールしてインデックスを構築し、その中から必要情報を抽出・提示する技術も出てきた。例えば、「gooグルメ&料理」や「goo旅行」では、これらの技術を組み合わせることにより、地図と連動させた国内最大規模となる約6万件の飲食店検索機能や、5つの宿泊情報専門サイトを横断した、宿泊施設情報検索サービスを提供している。
4. Better-Displayed Resultsを実現する技術
検索結果をより適切に表示する方法については、さまざまな観点から技術開発が進んでいる。その1つが、検索結果をクラスタリング表示(注2)する技術である。具体的な例としては、ビビシモが開発した「Clusty」などがある。
また、ニュース記事に対するキーワード検索結果の中から共通する主要なトピック(人物名や組織名、場所などの固有表現)を抽出、それを基に検索結果をさらに分類提示し、検索結果の全体像を把握しやすくするとともに、トピックを手がかりにスピーディに目的の情報を探し出せるようにする技術も登場している。この例としては、gooラボの「ニュース記事分類・検索実験(TopicMaster)」などが挙げられる。
さらに、ほかのアプローチとしては、視認性、総覧性に着目した表示技術もある。この実現例としては、Webサイトや画像、書籍など複数の検索結果をユーザーの指定により、同一ページに表示する技術(A9.comポータル)や、検索されたWebページをサムネール化し、検索結果と合わせて表示する技術(Viewpoint.comポータル)などがある。
また次世代技術としては、gooラボの「マルチメディア検索実験(MultiMedia Meister)」の中で、「3D空間に表示する機能」(画面2)なども登場している。これは、インターネットから収集した画像や動画などの情報を分析して3次元空間に配置、その中を自由に動き回ることで、直感的にマルチメディア・コンテンツを閲覧可能とするものである。
| 画面2:マルチメディア検索実験の、3D空間に表示する検索結果イメージ |
5. マルチメディア検索技術の現在
5. 従来のマルチメディア検索は、マルチメディア・コンテンツを含むWebページに掲載されている文字情報に基づき、入力されたキーワードと合致するページを検索結果として提示、さらにキーワードを追加することで検索結果を絞り込んでいくというものであった。
そのため、「富士山」というキーワードで画像を検索した場合、検索結果の中から「こんな景色の画像だけ選別したい」と思っても、「こんな景色」を的確にテキスト情報で表現できなければ、なかなか求める検索結果にはたどり着けなかった。
この問題を解決するために、いくつかの技術が提案されている。一般的な画像検索とは異なるが、Google Labsの「Google Video」はクローズド・キャプション(注3)を基にニュース映像などの検索を可能としている。また、「Yahoo! Video Search 」では、Media RSS(注4)という新しいメタデータを検索キーに利用している。
静止画や動画といったマルチメディア・コンテンツそのものの特徴をとらえ、これまでのマルチメディア検索サービスで一般的であったキーワード入力による検索に加え、画像の特徴といった直感的な視覚情報から、似たようなコンテンツの絞り込みを可能とする新しい技術が、gooラボの「マルチメディア検索実験(MultiMedia Meister)」(画面3)である。
| 画面3:MultiMedia Meisterの検索結果のイメージ |
MultiMedia Meisterで検証されている技術のポイントは、「類似画像検索技術」「画像クラスタリング技術」である。類似画像検索技術は、静止画や動画を構成する画像の特徴(色および形状)を数値化し、そのデータを基に色や形状の類似性を解析することで、絞り込み検索を可能とするものだ。
また、画像クラスタリング技術は、サムネール画像の類似性を判断する際に、画像の特徴だけではなく、画像が掲載されているWebページの文字情報も併用して自動的に分類することで、高速かつ精度の高い画像検索を可能とするもので、テキスト情報だけで分類した場合の約半分の時間で、より多くの検索結果を提示できる。
注2:マルチメディア検索実験の、3D空間に表示する検索結果イメージ注3:テレビ画面上に文字を表示するための方法、またはテレビ画面上に表示された文字注4:edia RSSとは、従来テキスト・データを中心としてきたRSSの機能を、画像データにも拡大させたもの

