【 ここから本文 】
Googleウォッチ
ソーシャルブックマークに登録 :
印刷用ページの表示
エンタープライズ検索テクノロジーの「着眼点」
企業ITインフラ上での位置づけを押さえ、導入に備えよう
(2006年09月19日)
RDBMSとエンタープライズ検索システムの相違点
ここ最近、企業内の膨大なデータを取り扱う際に、検索技術と既存のデータベース関連技術のどちらを使うべきかを検討する声をしばしば聞くようになった。そこで、ここでは、企業内の情報を効率的に検索するシステムとして長らく利用されてきたRDBMSとエンタープライズ検索との違いをはっきりさせておくことにしたい。
RDBMSは、データ・レコードに属性と対象データをセットで取り込んだ後、SQL文で探すという仕組みである。一方、検索は、インデックス情報とファイルへのアクセス権だけを実データとは切り離しておくという手法をとる。後者のほうが1カ所に保持しておくデータ量を抑制できる分だけ、大量かつ大容量のデータへの対応がしやすい。検索技術の大量データへの対応力は、Web検索の世界で数十億というサイトを対象に瞬時にレスポンスを戻せるという事実によって、すでに裏打ちされている。
また、RDBMSの場合、システムの大規模化に伴って、レスポンスを維持するためにメモリやCPUといったリソースが追加された結果、コストが跳ね上がるというケースが多々見られる。蓄積したデータ量に比例してコストが上昇していくとなると、サービス規模に比例してシステムに投じるコストも増大することになるため投資効率が上がらない。これは、今日のコンピュータ・ハードウェアとRDBMSの組み合わせにおいて必然的に発生する限界と言ってもよい。
とはいえ、検索技術が一方的にすぐれているかと言えば、もちろんそうとばかりは言い切れない。第一に、現時点では、検索技術には演算処理に弱いという欠点がある。SQLでは普通にこなせるような複雑な分析もまだサポートされておらず、代替技術ではなく補完技術だと考えるのが正しいと言える。
つまり、これからは、RDBMSで解決するか、エンタープライズ検索を導入して解決するか、もしくは両者をどう組み合わせるかの判断が重要になってくるわけである。
図2に、検索技術を企業システムに適用する際のポジショニングを示した。実際の導入プロセスでは当面、各専門用途のシステム/アプリケーションをそのまま残した形で、フロントエンドの補助ツールとしてエンタープライズ検索(ないしは、Web検索)を導入するという形が考えられる。
| 図2:企業情報システムにおけるエンタープライズ検索/Web検索の適用例(資料:ウチダスペクトラム)
|
例えば、集計分析などで専門用途のシステムが扱わない処理を引き受ける、あるいは目的が明確化されているわけではないが、とりあえず検索にかけてみるといった使われ方が予想される。こうした役割のイメージはWeb検索と似通っていると言える。
なお、誤解のないように補足しておくが、エンタープライズ検索の場合、検索といっても、必ずしも単純な検索結果リストがブラウザ上に表示される形をとるとは限らない。
例えば、ユーザー・インタフェースに何らかのテンプレートを利用したり、カスタマイズを施したりすることで、複雑なドリルダウンが必要とされないレベルの(定型リポートが出力可能であるといったレベルの)簡易版のBIツールとして用いることはできるだろう。また、多少のカスタマイズは発生するものの、RDBMSのレコードと特定アプリケーションのデータを組み合わせて表示するぐらいのことなら現時点でもすでに実現可能である。
代表的な市場プレーヤーのポジション比較
では、エンタープライズ検索というホットな市場に、ベンダー各社はどのような戦略と特徴をもって製品/サービスを提供しようとしているのであろうか。ここでは代表的なプレーヤーとしてグーグル、ファスト、オラクル、マイクロソフトの4社を取り上げてみたい(表1)。
専業ではないオラクルとマイクロソフトは、現状の事業基盤をうまく生かすことのできる展開を狙ってくるだろう。
オラクルはOracleデータベースとの高度な連携・統合を売りにするのはもちろん、SOA(サービス指向アーキテクチャ)を軸に企業内データ・アクセス能力を高め、Oracleデータベースを含めた各種データの統合度を高めるレイヤを追加することで、検索系のモジュールにかかる負担を減らしたアーキテクチャの提供を目指している。
マイクロソフトは、本稿執筆時点ではまだ出方がはっきりしないものの、普通に考えれば、周辺の同社製ソフトウェア群との親和性を武器に普及を図るという図式が思い浮かぶ。
これに対し、グーグル、ファストなどの専業ベンダーは、エンタープライズの分野では一見、強力な検索エンジン以外には何も強みを持たないようにも見える。だが、OSや業務アプリケーションなどの提供元ではないこれらのベンダーは、中立な立場での技術/サービスの提供が可能である。そしてこの事業の中立性は、メディア・ビジネスと同様、企業内のあらゆるデータのアクセス権をバランスよく設定するうえで非常に重要な要素となる。
また、Web検索の世界で高いシェアを誇るグーグルの場合、インターネットとイントラネットをスムーズにつなげるというアプローチを取りやすいポジションにあると言える。おそらくは、あらゆるデータをサーバ側に集中的に蓄積して解析を行うという、大規模なシン・クライアントのようなアプローチを進めることを計画しているのではないだろうか。
一方、エンタープライズ検索に特化した形ですでに市場で実績を上げているファストは、この4社の中では中間的なポジションに位置するプレーヤーとして興味深い存在だ。同社はオープン型のアーキテクチャを維持しつつ、各種のビジネス・ニーズに対応するプラグインを追加していくことで周辺アプリケーションとの連動性を高めるというアプローチを志向し、その線に沿って研究開発を進めている。
| 表1:エンタープライズ検索4社の比較 |
エンタープライズ検索の本質とメリット
ここまでの説明で、エンタープライズ選択にはWeb検索とは異なるユーザー・ニーズがあり、サービス提供側もすでに動き出していることを把握していただけたと思う。では、エンタープライズ検索は本質的に何を企業にもたらすのか。以下、享受しうるメリットを挙げながら、筆者の見解を示したい。
「データ利用効率の測定」に基づく新タイプの投資
企業内のあらゆるデータへのアクセシビリティを提供し、利用履歴を取得することも可能なエンタープライズ検索の導入によって、企業はデータの利用価値を測定できるようになる。「参照される情報には価値がある」という仮説の下、価値のあるデータとないデータを選り分けることが可能になり、既存のITコンポーネントのようなコスト削減重視型ではない、新しいタイプのIT投資が可能になると考えられる。
IT投資においてTCO(総所有コスト)が重要な概念であることは言うまでもないが、それを重視するあまり、成長機会を失ってしまっているとしたら、それは潜在的な損失以外の何物でもない。エンタープライズ検索を用いることで、企業は、外部からのデータ資産の購買も含めた投資を実際の効果を測定しつつ実施できるようになる。多少余計にコストがかかったとしても、より大きなリターンが得られるのであればビジネスとして投資する価値はあるというわけだ。
なお、図3に米国のIT市場調査会社IDCが行った、検索/コンテンツ管理技術の投資価値に関する調査結果を示したので参照されたい。
| 図3:米国IDCが実施した、検索コンテンツ管理技術の投資価値に関する調査の調査結果(資料:IDC, 2004) |
また、応用的な利用法になるが、検索キーワードの動向は、業務動向やビジネス動向を映し出す鏡だと言える。あるテーマが急に頻出するようになったり、逆に聞かなくなったりした場合、ビジネスの現場で何かが起きている可能性がある。変化が自社にチャンスをもたらすのかリスクをもたらすのかはその場では判断できないが、早い段階で動き自体をつかめるのは大きなメリットだ。
当たり前の話だが、人間は知らないことについては考えることができないし、気づいてもいないことについて対策を講じることもできない。この活用例としては、部門単位などでグルーピングを行い、検索キーワードの動向をウォッチして組織全体に“ビジネス変化センサー”をかけるといったようなことが考えられる。
とはいえ、先に述べたように、エンタープライズ検索は、投資の考え方においてコスト削減重視型の他のITコンポーネントとは根本的に異なる。この点には注意が必要で、実際のビジネス・プロセスにうまく適用できないと、効果を引き出せないまま、新しくシステムが増えただけという結果に終わってしまうこともありうる。
そのため、既存のレガシー・システムおよびデータが生かせるような導入方法と、投資効果の明確化を図るチェック体制の確立がセットでポイントとなる。事後検証が甘いと、他のシステム以上に無駄を生むこともあるが、そもそもエンタープライズ検索は、PDCAサイクルの下で運用して初めて価値を生むことのできるサービスなのである。
業務系/情報分析系で投資サイクルを複線化
企業のITインフラにおいて、エンタープライズ検索はビジネス・インテリジェンス(BI)に代表される情報分析系ツールに似た役割を果たすことになるが、標準的なBIツールの場合には、ERPやCRMなどの業務アプリケーションとセットで導入されるケースが少なくない。その際、分析対象データと業務アプリケーションの結合の度合いが高いと、かえって柔軟な展開が図りにくくなることがある。
それに対し、BIツールの代わりにエンタープライズ検索を導入した場合、既存の業務アプリケーション/システムにおいてデータの構造や格納方法が大幅に変更された際には当然影響を受けるが、業務アプリケーションなどとの結びつきは基本的に疎結合の状態であるため、大幅な修正作業が発生するようなことはなく、リスクを最小化できる。
企業は、業務アプリケーションへの投資とエンタープライズ検索への投資について、それぞれのサイクルで展開できるので、柔軟かつ独自性の高いサービスの立案/開発が行える。このことからも、エンタープライズ検索は、グループウェアのような情報共有系ツールと同じカテゴリーに位置づけることができる。
SOX法対応など、コンプライアンスを推進
コンプライアンス重視の声が強まるなか、昨今では国内でも、情報のアクセス権管理、利用履歴のトラッキングなどには、あらゆる企業が標準で対応すべきだと言われるようになった。
そう頻繁に起きては困るが、トラブル発生時に監査部門あるいは外部からの要請を受けて該当するファイルやメール・メッセージを企業内の全データから迅速に取り出せるような体制を築いておけば、対策の検討などを先手を打って進めることも可能になる。
どちらかと言えば副次的効果に分類されるメリットではあるが、企業のリスク管理という大きな枠組みでとらえても有効なツールであると言うことができる。
導入した企業に具体的なメリットをもたらすだけでなく、データの利用効率ベースで情報資産を再評価するという、IT投資に対する考え方を一変させるトレンドにつながる動き──これこそが、エンタープライズ検索というムーブメントの本質につながる動きなのである。
【COLUMN 02】
ユーザーごとに最短で最良の結果を導き出す仕組み
福原 亮
読者は、これまで検索エンジンを利用してきて、次のように思ったことはないだろうか。
「なぜ、これが検索結果の上位に含まれているのだろうか」
「なぜ、こんな関係のないキーワードでヒットするのだろうか」
「絞り込み検索と言うが、本当に絞り込まれているのだろうか」
「なぜ、この情報はどこにも載っていないのだろうか」
もしかすると、さらに、「検索というサービスは、しょせんこの程度の品質なのだろう」といった思い込みの下に、そういったことのすべてを納得してしまっているようなケースもあるかもしれない。検索サービスにおいて最も重要なのは、もちろん検索結果の精度の高さ(納得できる結果)と求めている情報に容易に到達できることだ。データベースやアプリケーションのファイル形式の種類や情報の格納場所にかかわらず、求めている情報に簡単にたどり着けることが、ユーザーの本来の要求なのである。
ファストサーチ&トランスファが提供するエンタープライズ検索システムのセールス・ポイントは、ユーザーの「シナリオ」を検索に反映させることができる点である。
検索対象となるドキュメントを収集し、インデックスに格納する際、ドキュメント処理と呼ばれるプロセスで、対象のドキュメントがどういう内容のものなのかについて解析が行われる。カテゴリー分けを行ったり、内容が肯定的なのか否定的なのかを判断したりと、あらかじめ想定した結果を作り込むことで、ナレッジとしての付加価値を高めるプロセスを組み込むことができるようになる。
ファストのドキュメント処理プロセスは、インデックスを作る前の段階と、ユーザー・インタフェース側の2カ所に存在する(下図)。これにより、検索時に使用するキーワードを解析することと、検索結果を解析してカテゴライズされた結果を提示することの2つが瞬時に行われる。したがって、同じキーワードを利用しても、ユーザーによって結果を違えることができ、ユーザーごとに求めている結果をカスタマイズして提供することができる。
| ファストが提供するESP(Enterprise Search Platform)における「ドキュメント処理」プロセス
|
【インタビュー】「検索エンジンは今やミッション・クリティカル・アプリケーションである」――ファストサーチCEOのレルヴィック氏


オラクルCEOのエリソン氏、エンタープライズ検索システムを世界初披露


【Oracle OpenWorld Tokyo 2006】































