強みは「意味を考慮する検索テクノロジー」――オートノミーCEO
指紋照合のパターン・マッチング技術を情報検索領域に応用英国に本社を置くオートノミーは、検索プラットフォーム「IDOL(Intelligent Data Operating Layer)」を中核に、エンタープライズ検索製品を開発/販売するベンダーである。編集部では、来日したオートノミーCEO、スタウファー・イーガン氏にインタビューを行う機会を得て、同社の成り立ちやテクノロジー/製品の特徴などについて聞いた。
大川 泰
Computerworld編集部
――まずは、オートノミーという会社の成り立ちについて教えてほしい。
イーガン氏:オートノミーは、英国において1996年に、ケンブリッジ・ニューロダイナミクスという企業からスピンオフする形で設立された。その後、欧州だけではなく、アメリカ、アジアでも成長を続け、1999年にはロンドン証券取引所でIPOを行うに至った。
オートノミーの設立者はマイケル・リンチ博士という人物だ。リンチ博士がケンブリッジ大学で博士号を取得した研究の成果が当社のビジネスのベースになっている。その研究とは、指紋照合に利用するパターン・マッチング技術である。このパターン・マッチング技術を情報検索領域に適用して当社の製品が生まれたわけだ。
――パターン・マッチング技術を情報検索に応用することで、どのようなことが可能になるのだろうか。
イーガン氏:オートノミーのテクノロジーは、検索対象の情報に備わるパターンを認識し、ソフトウェアがその情報の内容を理解するというものだ。通常のキーワード検索のように、情報の中にどのような単語が並んでいるのかを認識するだけではなく、その情報においてどのような話題が取り上げられているのかを理解するのだ。つまり、情報の意味に基づいて検索を行うことになる。
通常のキーワード検索では、検索ワードに紐づいてさまざまな内容の情報がすべて検索結果に出てきてしまう。だが、当社のテクノロジーでは、情報の内容を理解したうえで検索を行うため、必要な情報や類似した情報だけを返すことができる。しかも、検索が可能なファイル形式は400以上にも上り、音声データや映像データの検索にも対応している。
――音声や動画に対しては、どのような形で検索を行うのだろうか。
イーガン氏:「Computerworld」という音声を例に説明しよう。当社のテクノロジーでは、ここから情報を取得するストリームを2つ用いる。1つは「Computerworld」という単語を認識するストリームだ。もう1つのストリームでは、音声学的な意味での“音”を認識する。「コン」「ピュー」「ター」といった具合で音のユニットを取得するのだ。この単語と音という2つの要素を持ってきてマッチングを行う。
動画の場合は、音声に対して同様な手法でマッチングを行う。加えて、場面の変遷や話者の変化といったきっかけとなるシーンを認識して検索に活用する。
ちなみに、当社の音声技術は米国や英国において情報機関で用いられている。その用途はテロ対策である。携帯電話やラジオ、テレビの電波などからテロに関連する情報を見つけるために活用されているのだ。
――Computerworldのアンケートでは、「(検索結果の)情報量が多すぎて、必要な情報になかなかたどりつけない」という不満を持つ読者が約18%いた(Computerworld Technology Research(TR)No.42/月刊Computerworld 2007年6月号調査)。この結果についてどのように考えるか。
イーガン氏:本当にそのとおりだと思う。まさに、そのような悩みがあるからこそ、オートノミーが成功してきたのだ。回答者のほとんどは、キーワードによる検索を念頭に置いているのだろうが、「日本」というキーワードだけでも、日本航空や日本郵船など多様な単語につながる。キーワード検索で7,000件もヒットするような状況でも、内容を判断して検索結果を返す当社のテクノロジーを用いれば、20件程度に絞ることができるはずだ。
――オートノミーは、2005年は検索ソフトの米国ベリティ、今年は電子開示支援ソフト・ベンダーの米国ザンタズを買収した。これらの買収の目的を教えてほしい。
イーガン氏:ベリティはもともと競合であり、顧客の拡大などが買収の目的だった。一方、ザンタズの場合は、新たな技術の獲得およびそれを利用した市場の拡大が目的だ。この買収以前、われわれのテクノロジーは、“現在の情報”に検索対象を絞り、アーカイブされた過去の情報は検索の対象としていなかった。そこでアーカイブのテクノロジーを持つザンタズを買収したのだ。
今日、企業に対しては膨大な量の情報を保存しておくことが求められている。内部統制/コンプライアンスという非常に大きなドライバーがあることに加え、CRMやナレッジ・マネジメントのようなアプリケーションのためにも、情報が重要な資産として扱われるようになってきた。以前であれば捨てていたような情報も含めて保存、そして再利用しようという今日のトレンドから、アーカイブ検索の重要度が大きくなってきたわけだ。
























