【 ここから本文 】
ソフトウェア&サービス
ソーシャルブックマークに登録 :
印刷用ページの表示
[米国]
検索語の意味を解釈する次世代検索エンジン「Hakia」の実力とは
Webページから「知識の断片」を収集し、適切な検索結果を生成
(2007年03月01日)
検索語の意味を解釈する新しいWeb検索エンジン「Hakia」の最新ベータ版が利用可能になっている。これは、ニューヨークに拠点を置く米国ハキアが開発を進めているもので、最終版は今年末までに提供される予定だ。
| 「Hakia」エンジンの検索結果画面 |
この検索エンジンでは、「George Washington(ジョージ・ワシントン)」という語句を検索にかけると、「Biography and Timeline(経歴と年表)」「Speeches(演説)」「Photographs(写真)」「Research and Statistics(研究と統計)」をはじめとする12のカテゴリごとに結果が表示される。
ハキアのエンジニアは、同エンジンを開発する過程で関連するWebページを徹底的に分析し、同社の創立者で現CEOのライザ・バーカン氏が「knowledge bits(知識の断片)」と呼ぶ関連情報を抽出できるようにした。日付、人名、出来事といった情報に注目することで、Hakiaは既存の検索エンジンを上回る精度を持つことができたという。
結果ページの冒頭部分には、検索対象に関するより詳しい情報を調べられることをユーザーに示唆する一文が、目立つ位置に表示される。
実際に、同エンジンで、「What was George Washington's greatest accomplishment?(ジョージ・ワシントンの最大の功績は何か?)」という質問を入力すると、Hakiaの仮想ガイドは「never losing so great a battle that he couldn't continue to fight(戦いを続けられないほどひどい負け方をしなかったこと)」という結果を返す。
このときの検索結果には、当然ながらワシントンの独立戦争における功績を記したWebページも含まれている。
同検索エンジンに利用されている独創的な技術を開発したバーカン氏は、米国エネルギー省に在籍していた当時、人工知能を用いて米国の核兵器計画関連文書を分類する研究に没頭した経験を持つ。
原子物理学者としての教育を受けたバーカン氏は、検索エンジンの開発に自然言語処理技術を応用することを目指して2004年にハキアを設立した。同氏によると、一致する語句に基づいて単にWebページを索引化するのではなく、検索ボックスに入力された単語から、ユーザーが必要とする情報の意味を解釈できる検索エンジンの開発に取り組んできたという。
バーカン氏は、Hakiaと従来の索引ベース検索エンジンは、2つの点で異なると説明する。
1つ目は、(検索クエリ中の)質問を検証するだけで、どのような概念が含まれているのかを理解できるということ。ハキアの開発者は、過去2年間にわたり手作業で概念マップを作り上げ、それらの関係性を把握したという。
もう1つは、Webページ上の語句を基に検索結果を分類する代わりに、「QDEXing」と呼ばれる技術を駆使して妥当性の高い結果を引き出すことができること。QDEXingは、日付、人名、出来事といった関連情報、すなわち知識の断片を個々のWebページから収集し、より適切な検索結果を生成する手法である。
「われわれは、任意のページに含まれている概念やページ自体の信頼性といった要素の分析に、膨大な時間を費やしている。そうした要素を重視すると、返ってきた検索結果の数はそれほど意味を持たなくなる。大切なのは、検索結果が有している知識の断片の数だ」(バーカン氏)
(ヘザー・ヘイブンステイン/Computerworld オンライン米国版)
「Web 2.0 Summit」で語られたコンピューティングの未来


イノベーション創出のため、Web 2.0を製品戦略に取り入れるベンダー各社
[米国]ビビシモ、インデックスを容易に複製できる企業検索エンジンを発表
複数サーバにまたがってインデックスを容易にコピー可能
Web 2.0時代のプラットフォームを握ることで、日本のIT業界は再び輝きを取り戻せるか
Google、Yahoo!、MSN、goo……次世代の高機能検索エンジンで、どのようなサービスが実現するのか?


