【 ここから本文 】

データ・マネジメント

ソーシャルブックマークに登録 : Yahoo!ブックマークに登録 はてなブックマークに登録 del.icio.usに登録 newsing it!に登録 Buzzurlにブックマーク livedoorクリップに登録 Slashdotにタレコむ イザ!ブックマークに登録 Twitterでつぶやく
print 印刷用ページの表示


【解説】
「分析は力なり」みずからの創意工夫で競争優位に立つ

構造化/非構造化を問わず、あらゆるデータからトレンドを得る

(2008年03月04日)

数あるITの中でも、ビジネス・インテリジェンス(BI)は、特にユーザーのスキルが導入の成否に直結すると言われる。ここ数年、BIで大きな効果を上げた先進的な企業が着目しているのは、ユーザーみずからの「分析力」である。本稿では、非構造化データから重要なトレンドを発見する分析/マイニング・ツールを効果的に活用することで、競合他社との差別化を図ることができた米国企業の事例を挙げながら、“分析の極意”に迫ってみたい。

Jennifer McAdams/Heather Havenstein
Computerworld米国版

パワフルな組み合わせ──BIとテキスト分析

 今、医療業界や保険、金融業界の先進ユーザー企業の多くが、ビジネス・インテリジェンス(BI)ツールが主に扱う構造化データを、非構造化テキストに結び付けることのメリットに着目している。

 テキスト分析(Text Analytics)/テキスト・マイニング・ツールは、企業内のあちこちに分散する非構造化テキストを系統立てるため、言語学、ルール・ベースの自然言語処理、特殊化したアルゴリズムなどのメソッドを用いる。最近では、種類の異なる複数の文書管理システム、電子メールやインスタント・メッセージング(IM)、さらにはブログやWebサイトに記載された情報までもマイニングの対象とするべく、テキスト分析ツールを導入する企業が増えている。

 その目的は、静的なBIリポートに新たな息吹を吹き込むことだ。テキスト分析ツールは、非構造化データであるテキストに埋もれている事実や考え方、データの関係を抽出したうえで構造化データに変換し、BIツールとの連携を図れるようにする機能を提供する。このツールを適切に活用すれば、主としてデータ・ウェアハウス(DWH)、あるいはERPやCRMといった大規模な業務アプリケーションから収集したBIデータのコンテキストと意味性を高めることが可能になる。

 一部の先進ユーザーは、テキスト分析とBIのコンビネーションが非常にパワフルであることを知っているのだが、まだ一般的ではないようだ。米国の市場調査会社Forrester Researchのアナリスト、ボリス・エヴェルソン(Boris Evelson)氏は、「プロセスとユーザー・インタフェース(UI)に関して言うと、ほとんどの人はBIと聞いて構造化データのみを扱うOLAP(Online Analytical Processing:オンライン分析処理)を連想するはずである。しかし、より価値のある分析結果を得るには、OLAPの際、ユーザーにシームレスなやり方で非構造化データを対象にする必要もあるのだ」と説明する。

 「事実、高度なBIシステムを構築するために多額の資金を投じていながらも、IT部門の幹部たちは、貴重な情報が格納されているデータの多くが、いまだ社内のあちこちに非構造化テキストのままで放置されていることにも気づいている」と指摘するのは、米国の市場調査会社Nucleus Researchのアナリスト、デビッド・オコーネル(David O'Connell)氏だ。

 社内に散在するデータには、マーケティングや販売キャンペーンの結果、顧客の購買傾向など、市場での競争上、非常に重要な情報が含まれている。しかし、これらのトレンドを見いだし追跡するには、分析を自動化してBIと組み合わせるしか方法はない、というのがO'Connell氏の持論である。

 「従来のBIツールにテキスト分析機能を“ボルト・オン”することで、BIの価値がさらに高まるのだ。しかも、データ・クレンジングの処理はわずかで済むため、莫大なコストがかかるようなこともない。これにより、最終的に既存のBIツールでROI(投資利益率)の向上を図ることができるようになる」(O'Connell氏)

事例が物語るテキスト分析ツールの威力

 テキスト分析と組み合わせてBIを拡張することのメリットは、米国テネシー州チャッタヌーガに本社を置く保険会社、BlueCross BlueShield of Tennessee(BCBS)の例を見ればわかりやすい。BCBSは、この2つのテクノロジーを効果的に連携させることで、4種の疾病カテゴリにおける高リスクおよび低リスクの保険加入者に対する保険コストの分析精度を高めることに成功している。

 「関連性の高い構造化データと非構造化データを組み合わせることで、業務を新たな視点から見られるようにし、新たな分析手法を可能にする。それらとともに、従業員に対しては、拡張BIという形で、より行動しやすい情報を提供できるようになった」と、BCBSでチーフ・データ・アーキテクトを務めるデータ・リソース/マネジメント担当シニア・マネジャーのフランク・ブルックス(Frank Brooks)氏は語る。

画面1:米国SAS Instituteのテキスト分析ツール「Text Miner」の操作画面

 BCBSのBIシステムは、カナダのCognosが提供する「Cognos 8 BI」をベースに、米国SAS Instituteの「Text Miner」(画面1)および米国IBMの「OmniFind Analytics Edition」という2種類のテキスト分析/マイニング・ツールによって構築されている。Brooks氏によると、2種類の分析ツールは、BCBSみずからが構築し運用するコンセプト証明アプリケーションで大きな役割を果たしているという。同氏はこう話す。

 「コンセプト証明アプリケーションの構築・運用の過程で、われわれは、非構造化データに隠された意味を、既存の構造化データにおける意味に変換できることを理解した」

 SASのText Minerは、複数のファイルタイプ(PDF、ASCII、HTML、Microsoft Word)に含まれているデータを操作し、特異値分解(Singular Value Decomposition)技術を用いてテキストを数値表現としてレンダリングする。これらの数値モデルは、Microsoft ExcelやSASの各種BIツールなど、BIクライアント・ソフトウェアにあらかじめ用意されている。

 一方、IBMのOmniFind Analytics Editionは、IBM Researchが開発した「UIMA(Unstructured Information Management Architecture)」を主軸にしている。UIMAは、非構造化テキストを「WebSphere Portal Server」や「Lotus Workplace」といったミドルウェアやシステムに統合可能なコンポーネントに変換するための言語処理を実行する際、コア・アルゴリズムを利用する(WebSphere Portal Serverなどのミドルウェア/システムは、大規模なBIアプリケーションの稼働環境となるケースが多い)。

 BCBSなどの大手保険会社に加え、金融サービス会社も、比較的早くからBIとテキスト分析の組み合わせに着目してきた。Forresterの調査リポートによると、テキスト分析はリスク・マネジメントなどの分野にも適用できるという。そのリポートでは、大手金融機関に勤める詐欺対策の専門家がBIとテキスト分析を用いて「監視リスト」を作り、法的開示文書をコンパイルした事例が紹介されている。データセットを手作業で関連づけていたら、この作業はまず不可能だったはずだ。

 米国の財務プランニング関連のSIベンダー、Kettley Publishingは、同社顧客である財務プランナーが最も関連性の高いコンテンツにアクセスできるよう、BIとテキスト分析の機能の連携を試みた。「BIとテキスト分析の組み合わせは強力だ。これらにより、“雑然としたデータ”を意思決定に役立つ形に変換できる」と、Kettleyの開発担当ディレクター、ジム・コノリー(Jim Connolly)氏は賞賛する。

 テキストを構造化するのにあたってKettleyでは、WWF(Windows Workflow Foundation)プログラミング・モデルを用いてテキスト分析機能を自社開発した。Connolly氏によれば、この機能は大規模なエンタープライズ検索機能にステップアップするための土台となるものだという。「実装はスムースに行き、所要期間も1人月未満だった」と同氏。

 「BIベンダーがこぞって自社の製品ポートフォリオにテキスト分析機能を追加するなか、こうしたシステムに対する企業側の関心を真っ先にビジネスに結び付けるのはSIベンダーだろう」と、ForresterのEvelson氏は解説する。

 「ただし、まだ統合が課題として残る。ソフトウェアに1ドル投資するとしたら、システムの統合に少なくとも3〜5ドルはかかると見るべきだ」(同氏)

COLUMN
最愛の夫の脚部切断を回避した「BIとテキスト分析」

Jennifer McAdams/Computerworld米国版

 ある女性教授は、テキスト分析とBIを組み合わせることで、夫の脚を切断の危機から救うことができた。

 米国ケンタッキー州立Louisville大学の数学教授、パトリシア・セリート(Patricia Cerrito)氏にとって、BIとテキストの乖離がもう少しで悲しい結果を招くところだった。彼女の夫が糖尿病に加え、感染症による骨髄炎まで患い、ひざから下を切断する危機に直面していたのだ。

 代替療法として抗生物質を使う手もあったが、医師たちから、Cerrito氏自身が投薬量と副作用についての情報を提供しないかぎり、承諾を出せないと言われた。

 「その医師は、私たちがこの分野に詳しいことを知っていた。結局、夫の脚の運命は私たち夫婦にかかっていた。ほとんどの医師は、切断しなくても当分大丈夫だと思えるうちは、切断の延期を承諾するものだ」とCerrito氏。医師から要求された情報を用意するため、Cerrito氏は構造化されたBIの処方データをかき集め、そのデータを個々の医師が個人的に耳にした間接情報とつなぎ合わせるという作業に取り組んだ。

 問題は、医師が作成した患者情報は、種類の異なる文書管理システムに分散されて保管されていることだった。

 「医療の世界では、医師は独立した起業家のようなものだ。このため、変化が遅く、特に疾病管理に対する姿勢をなかなか変えようとしない」と、Cerrito氏は不満を漏らす。同氏は、BIの構造化データと非構造化テキストを結ぶインタフェースを構築することで、個々の疾病に対する代替療法についてより多くの情報を入手できるようにしたいと願った。

 SASのText Minerを使い、「複数の情報源から文字列を作成して意思決定の流れを調べられるようになった」とCerrito氏。Text Minerはこれら文字列をふるいにかけ、テキスト情報の各要素に関係性を見つけたあと、文書をフォーマットして分類する。こうして、Cerrito氏と夫、そして氏の教え子の学生たちは、病院の請求システムや医師のカルテに書かれたデータを掘り下げていけるわけだ。

 Cerrito氏は自身の経験を生かし、今は他の患者を1人でも多く救うべく努力している。

 「悲しいことに、同じような境遇にいた患者に、代替療法を知らなかったために脚を切断した人がいるのではないだろうか。私の調査からも、そういう人たちがいる可能性は高いと思う」(Cerrito氏)


 |123 > 次のページへ



▲ページの先頭へ戻る


特別企画

日立のストレージ・ソリューション

柔軟なデータ・マネジメント戦略でビジネスを加速させよ

“仮想化”を基盤とした総合力で、情報資産の活用を支援する日立製作所のストレージ・ソリューション

キーパーソン

アドビ システムズ

円滑なビジネス・コミュニケーションを実現する秘訣とは――アドビLiveCycle担当者に聞く

「必要な情報が理解できる形で伝わっていないという状況を改善したい」

データディレクトテクノロジーズ

「あらゆるデータソースに対するアクセスを提供する」――データディレクト幹部

DBコネクティビティの市場リーダーが語る技術と戦略

ETLツール活用

ETLツール「DataStage」の戦略的活用法

データ統合を強力に推進する情報資産管理基盤を使いこなすために

XML DBプロダクト・レビュー

「TX1」(東芝ソリューション)

自然言語処理機能で検索精度・速度が向上したXMLデータベース

データ統制

ビジネス・コンティニュイティでIT/IS部門が果たす役割

目指すは、ディザスタ・リカバリと事業継続マネジメントの“統合”

ディザスタ・リカバリの迷路を解く

複雑な状況の中、自社にとってのベスト・プランにたどり着くためには

エンタープライズ・データを守れ

担当者が負担に押しつぶされず、企業にとって価値のある情報を保護するために

ILMの導入で、IT運用コストを引き下げろ!

ILMを成功裏に導入するための“6つのステップ”

全社レベルでコンテンツを“統制”する「ECM」

今日のコンテンツ管理製品分野における最注目領域

過去のあらゆるデータをリカバリできるデータ保護技術「CDP」

データ・ロスとダウンタイムの最小化をも実現

コンプライアンスを重視したメール運用管理の実際

ECM/CMSではカバーしきれない最重要コンテンツ

“完全なる”ペーパーレス・オフィスの実現に向けて

「もはや企業に選択の余地はない!」

キャッチアップ

EMC、IBM、マイクロソフトの3社、CMSの相互運用仕様「CMIS」を共同開発

複数ベンダーのCMS/ECMを連携させるための仕様で、2009年中には標準化の見通し

米国小売企業の半数がデータ漏洩を経験――そのほとんどは公表されず

「われわれが耳にするよりはるかに多くの事件が起きている」

デデュープ、HDDスピンダウン、SSD――EMC幹部が最新技術を紹介

「ストレージ分野は今、正に大きな変革期を迎えている」

生誕10周年を迎えた「XML」――その普及・活用の進展度を知る

「もはや“空気”のような存在であり、必要不可欠なものに」

「データ品質がビジネスの成否を左右する」

TVJP栗原氏がデータ・アーキテクチャの全体最適化を提言

今、XMLデータベースが求められる理由

新たな利用領域を開拓しつつある第2世代の製品

2007 Officeの文書フォーマット「OOXML」を正しく知る

XMLは、これまでのOffice利用にまつわる課題を解決しうるか

エンタープライズ検索テクノロジーの「着眼点」

企業ITインフラ上での位置づけを押さえ、導入に備えよう

米国企業4社のビジネスGIS[先端活用事例]

GISとBIの統合でエリア・マーケティングが変わる!

ビジネス・インテリジェンス

ビジネス・インテリジェンス最新事情

ビジネス・インテリジェンス最新事情

組織と“個”の知的生産性を高める

データベース・トレンド

マイクロソフト、次期SQL ServerにBI技術「Gemini」を搭載へ

Geminiベースのセルフサービス分析機能でBIを強化(2008年10月7日)

IBM、初のインメモリDBを出荷――今年買収したソリッドのDBがベース

DB2/Informixと組み合わせたエディションも同時リリース(2008年6月24日)

サン、買収後初のアップグレード版「MySQL 5.1」をリリースへ

パーティショニング/イベント・スケジューリング機能などを強化(2008年4月14日)

「11gは顧客最優先版」――日本オラクル、Oracle DB新版のメイン機能を説明

自動管理、テスト作業軽減、ストレージ・コスト削減を実現(2007年9月3日)

イベント・リポート

【Computerworld Conference 2007 Fall】
ビジネスの核となる「情報・データ基盤」――どう強化し、どう活用すべきか

「新時代の情報系」に求められる技術と戦略

シマンテック

電子メールの保管・管理・検索を包括的に支援する、シマンテック「Enterprise Vault」の実力

(シマンテック)

日立製作所

今、求められる「情報統合」基盤の構築。そのカギは、日立が提供するETLツール「DataStage」

(日立製作所)

鉄飛テクノロジー

“Web 2.0時代のファイル検索”を提供。ファイル・サーバに特化した検索エンジン「FileBlog」

(鉄飛テクノロジー)

コグノス

意思決定/業務プロセスの緊密な統合を図る「コグノス・パフォーマンス・ソリューション」

(コグノス)

トレンド・ウォッチ

HP、最大容量820TBの“エクストリーム・ストレージ”「ExDS」を年内投入へ

主用途は膨大なメディア・データを収めるオンライン・コンテンツ・リポジトリ(2008年9月18日)

インテル、SAP、ネットアップ、ヴイエムウェアの4社、DRソリューションの共同検証を実施

各社製品でDR環境を構築し、ERPアプリの復旧を確認(2008年9月16日)

【IDC/Gartner調査】2008年2Qのディスク・ストレージ市場、容量・金額ともに2ケタ増を記録

総出荷容量は43%増の1,777PBへ――動画利用や各種法規制で需要が急増(2008年9月8日)

NECソフト、企業向けバックアップ・サービス「オンラインバックアップASP」を提供開始

データの種類やバックアップ・タイミングの指定が可能(2008年8月25日)

米国政府機関所有のノートPCで、暗号化されていたのはわずか3割

会計検査院が2007年9月時点のセキュリティ調査結果を報告(2008年7月30日)

新世代のテープ・ストレージが続々登場――より高密度、高速に

HPとソニーは新DATを共同開発。サンとIBMも1TBドライブをリリースへ(2008年7月16日)

マイクロソフトがOOXMLの相互運用性を強化、HTMLトランスレータを開発へ

Officeなどのプロトコル技術仕様も正式公開(2008年7月1日)

増え続けるストレージの電力・冷却コスト、2007年は全世界で13億ドルを突破

依然としてストレージ需要は旺盛、電力コストも増加の一途へ(2008年6月27日)

シマンテック、Xen仮想化技術をストレージ管理ソフトに統合

仮想マシンとストレージを単一コンソールで管理可能(2008年6月11日)

HP、BIワークロードの処理を効率化するDWHアプライアンス新版をリリース

短いクエリと大規模タスクをバランシング(2008年6月3日)

競争力の高いデータ管理基盤をいかに構築するか――ネットアップが提示する仮想化活用の実際

拡大するデデュープ市場を視野にストレージ・ポートフォリオを拡充(2008年4月21日)

IBM、データ・デデュープ技術のディリジェントを買収

データ管理における豊富なノウハウに基づくNetAppストレージ/仮想化製品群(2008年5月19日)

普及に拍車がかかるエンタープライズ検索、2012年には大規模企業の半数以上が導入

「エンタープライズ検索はシステム基盤のデフォルト機能になる」(2008年4月11日)

サイベース、独自手法の「リアルタイムBI」を披露

DBの差分ログをベースにデータを抽出・蓄積(2008年4月2日)

日本IBM、データ統合/管理ソフト「Information Server V8.1」を発表

IODコンセプトに基づき、企業内に分散する情報・データの統合を支援する製品(2008年3月6日)

[連載]バックアップ新論

第1回:デスクトップのバックアップ

第1ステップはユーザーへの喚起

第2回:データセンターのバックアップ

まずは経営上のリスクとコストとのバランスを評価

第3回:メッセージのバックアップ

内部統制に必須の重要課題に取り組む

第4回:ワークグループのバックアップ

「バックアップの盲点」をいかに克服するか

第5回:PDAのバックアップ

ネットワーク・デバイスとして管理する

第6回:ブランチ・オフィスのバックアップ

常に変化する“標的”を的確に“キャッチ”する

Weekly Ranking

集計期間:11/26〜12/02



Computerworld Global
米国
英国
中国
ドイツ
オーストラリア
シンガポール
その他の国