【 ここから本文 】

データ・マネジメント

ソーシャルブックマークに登録 : Yahoo!ブックマークに登録 はてなブックマークに登録 del.icio.usに登録 newsing it!に登録 Buzzurlにブックマーク livedoorクリップに登録 Slashdotにタレコむ イザ!ブックマークに登録 Twitterでつぶやく
print 印刷用ページの表示


エンタープライズ検索テクノロジーの「着眼点」

企業ITインフラ上での位置づけを押さえ、導入に備えよう

(2006年09月19日)

RDBMSとエンタープライズ検索システムの相違点

 ここ最近、企業内の膨大なデータを取り扱う際に、検索技術と既存のデータベース関連技術のどちらを使うべきかを検討する声をしばしば聞くようになった。そこで、ここでは、企業内の情報を効率的に検索するシステムとして長らく利用されてきたRDBMSとエンタープライズ検索との違いをはっきりさせておくことにしたい。

 RDBMSは、データ・レコードに属性と対象データをセットで取り込んだ後、SQL文で探すという仕組みである。一方、検索は、インデックス情報とファイルへのアクセス権だけを実データとは切り離しておくという手法をとる。後者のほうが1カ所に保持しておくデータ量を抑制できる分だけ、大量かつ大容量のデータへの対応がしやすい。検索技術の大量データへの対応力は、Web検索の世界で数十億というサイトを対象に瞬時にレスポンスを戻せるという事実によって、すでに裏打ちされている。

 また、RDBMSの場合、システムの大規模化に伴って、レスポンスを維持するためにメモリやCPUといったリソースが追加された結果、コストが跳ね上がるというケースが多々見られる。蓄積したデータ量に比例してコストが上昇していくとなると、サービス規模に比例してシステムに投じるコストも増大することになるため投資効率が上がらない。これは、今日のコンピュータ・ハードウェアとRDBMSの組み合わせにおいて必然的に発生する限界と言ってもよい。

 とはいえ、検索技術が一方的にすぐれているかと言えば、もちろんそうとばかりは言い切れない。第一に、現時点では、検索技術には演算処理に弱いという欠点がある。SQLでは普通にこなせるような複雑な分析もまだサポートされておらず、代替技術ではなく補完技術だと考えるのが正しいと言える。

 つまり、これからは、RDBMSで解決するか、エンタープライズ検索を導入して解決するか、もしくは両者をどう組み合わせるかの判断が重要になってくるわけである。

 図2に、検索技術を企業システムに適用する際のポジショニングを示した。実際の導入プロセスでは当面、各専門用途のシステム/アプリケーションをそのまま残した形で、フロントエンドの補助ツールとしてエンタープライズ検索(ないしは、Web検索)を導入するという形が考えられる。


図2:企業情報システムにおけるエンタープライズ検索/Web検索の適用例(資料:ウチダスペクトラム)

 例えば、集計分析などで専門用途のシステムが扱わない処理を引き受ける、あるいは目的が明確化されているわけではないが、とりあえず検索にかけてみるといった使われ方が予想される。こうした役割のイメージはWeb検索と似通っていると言える。

 なお、誤解のないように補足しておくが、エンタープライズ検索の場合、検索といっても、必ずしも単純な検索結果リストがブラウザ上に表示される形をとるとは限らない。

 例えば、ユーザー・インタフェースに何らかのテンプレートを利用したり、カスタマイズを施したりすることで、複雑なドリルダウンが必要とされないレベルの(定型リポートが出力可能であるといったレベルの)簡易版のBIツールとして用いることはできるだろう。また、多少のカスタマイズは発生するものの、RDBMSのレコードと特定アプリケーションのデータを組み合わせて表示するぐらいのことなら現時点でもすでに実現可能である。

代表的な市場プレーヤーのポジション比較

 では、エンタープライズ検索というホットな市場に、ベンダー各社はどのような戦略と特徴をもって製品/サービスを提供しようとしているのであろうか。ここでは代表的なプレーヤーとしてグーグル、ファスト、オラクル、マイクロソフトの4社を取り上げてみたい(表1)。

 専業ではないオラクルとマイクロソフトは、現状の事業基盤をうまく生かすことのできる展開を狙ってくるだろう。

 オラクルはOracleデータベースとの高度な連携・統合を売りにするのはもちろん、SOA(サービス指向アーキテクチャ)を軸に企業内データ・アクセス能力を高め、Oracleデータベースを含めた各種データの統合度を高めるレイヤを追加することで、検索系のモジュールにかかる負担を減らしたアーキテクチャの提供を目指している。

 マイクロソフトは、本稿執筆時点ではまだ出方がはっきりしないものの、普通に考えれば、周辺の同社製ソフトウェア群との親和性を武器に普及を図るという図式が思い浮かぶ。

 これに対し、グーグル、ファストなどの専業ベンダーは、エンタープライズの分野では一見、強力な検索エンジン以外には何も強みを持たないようにも見える。だが、OSや業務アプリケーションなどの提供元ではないこれらのベンダーは、中立な立場での技術/サービスの提供が可能である。そしてこの事業の中立性は、メディア・ビジネスと同様、企業内のあらゆるデータのアクセス権をバランスよく設定するうえで非常に重要な要素となる。

 また、Web検索の世界で高いシェアを誇るグーグルの場合、インターネットとイントラネットをスムーズにつなげるというアプローチを取りやすいポジションにあると言える。おそらくは、あらゆるデータをサーバ側に集中的に蓄積して解析を行うという、大規模なシン・クライアントのようなアプローチを進めることを計画しているのではないだろうか。

 一方、エンタープライズ検索に特化した形ですでに市場で実績を上げているファストは、この4社の中では中間的なポジションに位置するプレーヤーとして興味深い存在だ。同社はオープン型のアーキテクチャを維持しつつ、各種のビジネス・ニーズに対応するプラグインを追加していくことで周辺アプリケーションとの連動性を高めるというアプローチを志向し、その線に沿って研究開発を進めている。


表1:エンタープライズ検索4社の比較

エンタープライズ検索の本質とメリット

 ここまでの説明で、エンタープライズ選択にはWeb検索とは異なるユーザー・ニーズがあり、サービス提供側もすでに動き出していることを把握していただけたと思う。では、エンタープライズ検索は本質的に何を企業にもたらすのか。以下、享受しうるメリットを挙げながら、筆者の見解を示したい。

「データ利用効率の測定」に基づく新タイプの投資

 企業内のあらゆるデータへのアクセシビリティを提供し、利用履歴を取得することも可能なエンタープライズ検索の導入によって、企業はデータの利用価値を測定できるようになる。「参照される情報には価値がある」という仮説の下、価値のあるデータとないデータを選り分けることが可能になり、既存のITコンポーネントのようなコスト削減重視型ではない、新しいタイプのIT投資が可能になると考えられる。

 IT投資においてTCO(総所有コスト)が重要な概念であることは言うまでもないが、それを重視するあまり、成長機会を失ってしまっているとしたら、それは潜在的な損失以外の何物でもない。エンタープライズ検索を用いることで、企業は、外部からのデータ資産の購買も含めた投資を実際の効果を測定しつつ実施できるようになる。多少余計にコストがかかったとしても、より大きなリターンが得られるのであればビジネスとして投資する価値はあるというわけだ。

 なお、図3に米国のIT市場調査会社IDCが行った、検索/コンテンツ管理技術の投資価値に関する調査結果を示したので参照されたい。


図3:米国IDCが実施した、検索コンテンツ管理技術の投資価値に関する調査の調査結果(資料:IDC, 2004)

 また、応用的な利用法になるが、検索キーワードの動向は、業務動向やビジネス動向を映し出す鏡だと言える。あるテーマが急に頻出するようになったり、逆に聞かなくなったりした場合、ビジネスの現場で何かが起きている可能性がある。変化が自社にチャンスをもたらすのかリスクをもたらすのかはその場では判断できないが、早い段階で動き自体をつかめるのは大きなメリットだ。

 当たり前の話だが、人間は知らないことについては考えることができないし、気づいてもいないことについて対策を講じることもできない。この活用例としては、部門単位などでグルーピングを行い、検索キーワードの動向をウォッチして組織全体に“ビジネス変化センサー”をかけるといったようなことが考えられる。

 とはいえ、先に述べたように、エンタープライズ検索は、投資の考え方においてコスト削減重視型の他のITコンポーネントとは根本的に異なる。この点には注意が必要で、実際のビジネス・プロセスにうまく適用できないと、効果を引き出せないまま、新しくシステムが増えただけという結果に終わってしまうこともありうる。

 そのため、既存のレガシー・システムおよびデータが生かせるような導入方法と、投資効果の明確化を図るチェック体制の確立がセットでポイントとなる。事後検証が甘いと、他のシステム以上に無駄を生むこともあるが、そもそもエンタープライズ検索は、PDCAサイクルの下で運用して初めて価値を生むことのできるサービスなのである。

業務系/情報分析系で投資サイクルを複線化

 企業のITインフラにおいて、エンタープライズ検索はビジネス・インテリジェンス(BI)に代表される情報分析系ツールに似た役割を果たすことになるが、標準的なBIツールの場合には、ERPやCRMなどの業務アプリケーションとセットで導入されるケースが少なくない。その際、分析対象データと業務アプリケーションの結合の度合いが高いと、かえって柔軟な展開が図りにくくなることがある。

 それに対し、BIツールの代わりにエンタープライズ検索を導入した場合、既存の業務アプリケーション/システムにおいてデータの構造や格納方法が大幅に変更された際には当然影響を受けるが、業務アプリケーションなどとの結びつきは基本的に疎結合の状態であるため、大幅な修正作業が発生するようなことはなく、リスクを最小化できる。

 企業は、業務アプリケーションへの投資とエンタープライズ検索への投資について、それぞれのサイクルで展開できるので、柔軟かつ独自性の高いサービスの立案/開発が行える。このことからも、エンタープライズ検索は、グループウェアのような情報共有系ツールと同じカテゴリーに位置づけることができる。

SOX法対応など、コンプライアンスを推進

 コンプライアンス重視の声が強まるなか、昨今では国内でも、情報のアクセス権管理、利用履歴のトラッキングなどには、あらゆる企業が標準で対応すべきだと言われるようになった。

 そう頻繁に起きては困るが、トラブル発生時に監査部門あるいは外部からの要請を受けて該当するファイルやメール・メッセージを企業内の全データから迅速に取り出せるような体制を築いておけば、対策の検討などを先手を打って進めることも可能になる。

 どちらかと言えば副次的効果に分類されるメリットではあるが、企業のリスク管理という大きな枠組みでとらえても有効なツールであると言うことができる。

 導入した企業に具体的なメリットをもたらすだけでなく、データの利用効率ベースで情報資産を再評価するという、IT投資に対する考え方を一変させるトレンドにつながる動き──これこそが、エンタープライズ検索というムーブメントの本質につながる動きなのである。

【COLUMN 02】
ユーザーごとに最短で最良の結果を導き出す仕組み

福原 亮
 

 読者は、これまで検索エンジンを利用してきて、次のように思ったことはないだろうか。

「なぜ、これが検索結果の上位に含まれているのだろうか」
「なぜ、こんな関係のないキーワードでヒットするのだろうか」
「絞り込み検索と言うが、本当に絞り込まれているのだろうか」
「なぜ、この情報はどこにも載っていないのだろうか」

 もしかすると、さらに、「検索というサービスは、しょせんこの程度の品質なのだろう」といった思い込みの下に、そういったことのすべてを納得してしまっているようなケースもあるかもしれない。検索サービスにおいて最も重要なのは、もちろん検索結果の精度の高さ(納得できる結果)と求めている情報に容易に到達できることだ。データベースやアプリケーションのファイル形式の種類や情報の格納場所にかかわらず、求めている情報に簡単にたどり着けることが、ユーザーの本来の要求なのである。

 ファストサーチ&トランスファが提供するエンタープライズ検索システムのセールス・ポイントは、ユーザーの「シナリオ」を検索に反映させることができる点である。

 検索対象となるドキュメントを収集し、インデックスに格納する際、ドキュメント処理と呼ばれるプロセスで、対象のドキュメントがどういう内容のものなのかについて解析が行われる。カテゴリー分けを行ったり、内容が肯定的なのか否定的なのかを判断したりと、あらかじめ想定した結果を作り込むことで、ナレッジとしての付加価値を高めるプロセスを組み込むことができるようになる。

 ファストのドキュメント処理プロセスは、インデックスを作る前の段階と、ユーザー・インタフェース側の2カ所に存在する(下図)。これにより、検索時に使用するキーワードを解析することと、検索結果を解析してカテゴライズされた結果を提示することの2つが瞬時に行われる。したがって、同じキーワードを利用しても、ユーザーによって結果を違えることができ、ユーザーごとに求めている結果をカスタマイズして提供することができる。


ファストが提供するESP(Enterprise Search Platform)における「ドキュメント処理」プロセス

前のページへ < 1234 > 次のページへ



関連記事

▲ページの先頭へ戻る


特別企画

日立のストレージ・ソリューション

柔軟なデータ・マネジメント戦略でビジネスを加速させよ

“仮想化”を基盤とした総合力で、情報資産の活用を支援する日立製作所のストレージ・ソリューション

キーパーソン

アドビ システムズ

円滑なビジネス・コミュニケーションを実現する秘訣とは――アドビLiveCycle担当者に聞く

「必要な情報が理解できる形で伝わっていないという状況を改善したい」

データディレクトテクノロジーズ

「あらゆるデータソースに対するアクセスを提供する」――データディレクト幹部

DBコネクティビティの市場リーダーが語る技術と戦略

ETLツール活用

ETLツール「DataStage」の戦略的活用法

データ統合を強力に推進する情報資産管理基盤を使いこなすために

XML DBプロダクト・レビュー

「TX1」(東芝ソリューション)

自然言語処理機能で検索精度・速度が向上したXMLデータベース

データ統制

ビジネス・コンティニュイティでIT/IS部門が果たす役割

目指すは、ディザスタ・リカバリと事業継続マネジメントの“統合”

ディザスタ・リカバリの迷路を解く

複雑な状況の中、自社にとってのベスト・プランにたどり着くためには

エンタープライズ・データを守れ

担当者が負担に押しつぶされず、企業にとって価値のある情報を保護するために

ILMの導入で、IT運用コストを引き下げろ!

ILMを成功裏に導入するための“6つのステップ”

全社レベルでコンテンツを“統制”する「ECM」

今日のコンテンツ管理製品分野における最注目領域

過去のあらゆるデータをリカバリできるデータ保護技術「CDP」

データ・ロスとダウンタイムの最小化をも実現

コンプライアンスを重視したメール運用管理の実際

ECM/CMSではカバーしきれない最重要コンテンツ

“完全なる”ペーパーレス・オフィスの実現に向けて

「もはや企業に選択の余地はない!」

キャッチアップ

EMC、IBM、マイクロソフトの3社、CMSの相互運用仕様「CMIS」を共同開発

複数ベンダーのCMS/ECMを連携させるための仕様で、2009年中には標準化の見通し

米国小売企業の半数がデータ漏洩を経験――そのほとんどは公表されず

「われわれが耳にするよりはるかに多くの事件が起きている」

デデュープ、HDDスピンダウン、SSD――EMC幹部が最新技術を紹介

「ストレージ分野は今、正に大きな変革期を迎えている」

生誕10周年を迎えた「XML」――その普及・活用の進展度を知る

「もはや“空気”のような存在であり、必要不可欠なものに」

「データ品質がビジネスの成否を左右する」

TVJP栗原氏がデータ・アーキテクチャの全体最適化を提言

今、XMLデータベースが求められる理由

新たな利用領域を開拓しつつある第2世代の製品

2007 Officeの文書フォーマット「OOXML」を正しく知る

XMLは、これまでのOffice利用にまつわる課題を解決しうるか

エンタープライズ検索テクノロジーの「着眼点」

企業ITインフラ上での位置づけを押さえ、導入に備えよう

米国企業4社のビジネスGIS[先端活用事例]

GISとBIの統合でエリア・マーケティングが変わる!

ビジネス・インテリジェンス

ビジネス・インテリジェンス最新事情

ビジネス・インテリジェンス最新事情

組織と“個”の知的生産性を高める

データベース・トレンド

マイクロソフト、次期SQL ServerにBI技術「Gemini」を搭載へ

Geminiベースのセルフサービス分析機能でBIを強化(2008年10月7日)

IBM、初のインメモリDBを出荷――今年買収したソリッドのDBがベース

DB2/Informixと組み合わせたエディションも同時リリース(2008年6月24日)

サン、買収後初のアップグレード版「MySQL 5.1」をリリースへ

パーティショニング/イベント・スケジューリング機能などを強化(2008年4月14日)

「11gは顧客最優先版」――日本オラクル、Oracle DB新版のメイン機能を説明

自動管理、テスト作業軽減、ストレージ・コスト削減を実現(2007年9月3日)

イベント・リポート

【Computerworld Conference 2007 Fall】
ビジネスの核となる「情報・データ基盤」――どう強化し、どう活用すべきか

「新時代の情報系」に求められる技術と戦略

シマンテック

電子メールの保管・管理・検索を包括的に支援する、シマンテック「Enterprise Vault」の実力

(シマンテック)

日立製作所

今、求められる「情報統合」基盤の構築。そのカギは、日立が提供するETLツール「DataStage」

(日立製作所)

鉄飛テクノロジー

“Web 2.0時代のファイル検索”を提供。ファイル・サーバに特化した検索エンジン「FileBlog」

(鉄飛テクノロジー)

コグノス

意思決定/業務プロセスの緊密な統合を図る「コグノス・パフォーマンス・ソリューション」

(コグノス)

トレンド・ウォッチ

HP、最大容量820TBの“エクストリーム・ストレージ”「ExDS」を年内投入へ

主用途は膨大なメディア・データを収めるオンライン・コンテンツ・リポジトリ(2008年9月18日)

インテル、SAP、ネットアップ、ヴイエムウェアの4社、DRソリューションの共同検証を実施

各社製品でDR環境を構築し、ERPアプリの復旧を確認(2008年9月16日)

【IDC/Gartner調査】2008年2Qのディスク・ストレージ市場、容量・金額ともに2ケタ増を記録

総出荷容量は43%増の1,777PBへ――動画利用や各種法規制で需要が急増(2008年9月8日)

NECソフト、企業向けバックアップ・サービス「オンラインバックアップASP」を提供開始

データの種類やバックアップ・タイミングの指定が可能(2008年8月25日)

米国政府機関所有のノートPCで、暗号化されていたのはわずか3割

会計検査院が2007年9月時点のセキュリティ調査結果を報告(2008年7月30日)

新世代のテープ・ストレージが続々登場――より高密度、高速に

HPとソニーは新DATを共同開発。サンとIBMも1TBドライブをリリースへ(2008年7月16日)

マイクロソフトがOOXMLの相互運用性を強化、HTMLトランスレータを開発へ

Officeなどのプロトコル技術仕様も正式公開(2008年7月1日)

増え続けるストレージの電力・冷却コスト、2007年は全世界で13億ドルを突破

依然としてストレージ需要は旺盛、電力コストも増加の一途へ(2008年6月27日)

シマンテック、Xen仮想化技術をストレージ管理ソフトに統合

仮想マシンとストレージを単一コンソールで管理可能(2008年6月11日)

HP、BIワークロードの処理を効率化するDWHアプライアンス新版をリリース

短いクエリと大規模タスクをバランシング(2008年6月3日)

競争力の高いデータ管理基盤をいかに構築するか――ネットアップが提示する仮想化活用の実際

拡大するデデュープ市場を視野にストレージ・ポートフォリオを拡充(2008年4月21日)

IBM、データ・デデュープ技術のディリジェントを買収

データ管理における豊富なノウハウに基づくNetAppストレージ/仮想化製品群(2008年5月19日)

普及に拍車がかかるエンタープライズ検索、2012年には大規模企業の半数以上が導入

「エンタープライズ検索はシステム基盤のデフォルト機能になる」(2008年4月11日)

サイベース、独自手法の「リアルタイムBI」を披露

DBの差分ログをベースにデータを抽出・蓄積(2008年4月2日)

日本IBM、データ統合/管理ソフト「Information Server V8.1」を発表

IODコンセプトに基づき、企業内に分散する情報・データの統合を支援する製品(2008年3月6日)

[連載]バックアップ新論

第1回:デスクトップのバックアップ

第1ステップはユーザーへの喚起

第2回:データセンターのバックアップ

まずは経営上のリスクとコストとのバランスを評価

第3回:メッセージのバックアップ

内部統制に必須の重要課題に取り組む

第4回:ワークグループのバックアップ

「バックアップの盲点」をいかに克服するか

第5回:PDAのバックアップ

ネットワーク・デバイスとして管理する

第6回:ブランチ・オフィスのバックアップ

常に変化する“標的”を的確に“キャッチ”する

Weekly Ranking

集計期間:11/26〜12/02



Computerworld Global
米国
英国
中国
ドイツ
オーストラリア
シンガポール
その他の国