データ統合の要となるETL

 ビジネス環境が急速に変化するなか、複数の業務システムから横断的にデータを収集し、ビジネス上の意思決定に活用することが必要とされている。だが、それらのデータは個々の業務システムが処理しやすい独自の形式で格納されていることが多く、ほかの用途に利用しようとしても一筋縄ではいかない。

 そこで注目を集めているのが全社的なデータ統合であり、その実現には、各種業務システムから必要なデータを抽出して連携させるデータ管理基盤の導入が必要である。集めたデータを情報分析ツールで検索したり、様々な業務システムで活用したりすることで、ビジネス上の意思決定に役立てようというわけだ。

 データ管理基盤の導入にあたって要となるのがETL(Extract, Transform and Loading)と呼ばれる処理だ。すなわち、各種業務システムから必要なデータを抽出(Extract)し、そのデータを最適な形式に変換(Transform)して、データを他システムやデータベースに書き出す(Loading)という一連の作業である。

 これまで、このETL処理は手作りで開発されることが多かった。抽出したデータを変換して書き出す―― 一見、簡単なようだが、開発者にはデータソースとなる各種データベース製品に関する高度な知識や、プログラミングに関するスキルが求められ、長期に渡る開発期間が必要になることも多い。さらに、業務システムはビジネス環境の変化に伴い、頻繁に変更や拡張が行われる。そのたびにETL処理を開発し直すとなると、多大なコストと手間がかかってしまうのだ。

開発生産性と保守性を向上させる「DataStage」

 この問題を解決するのが、日立がデータ統合のための情報資産管理基盤と位置づけるETLツール「DataStage」である(図1)。同製品は2002年以降、国内のETL製品市場でトップ・シェアを維持しており、2006年には37.8%ものシェアを獲得している(富士キメラ総研の「2007 パッケージソリューション・マーケティング便覧」による)。

ETLツール「DataStage
図1:DWHを利用したデータ統合におけるETLツール「DataStage」の位置づけ

 DataStageがユーザーから多くの支持を集めている理由として、まずは開発生産性の高さが挙げられる。同製品では、プログラミングを行わずに、GUI上でデータ変換処理を行う部品を組み合わせて、パラメータを設定するというスタイルでETLジョブを開発でき、開発に要する時間を大幅に短縮することができる。開発画面は、データ・フローを視覚的に表現しているため、保守や拡張作業も行いやすい。

 保守や拡張作業について付け加えておきたいのは、DataStageは、個々のデータがどこで使われているのか、あるいは修正時にどこまで影響するのかを正確に把握するために、メタデータを一元管理する仕組みを用意しているという点だ。これにより、修正やテストが必要な範囲が明確になり、ジョブの変更/拡張時の開発効率を高めることができる。

 また、従来のプログラムやデータベースに関するスキル習得に比べて、DataStageのジョブ開発のスキル習得は易しいため、開発のための人材確保も容易である。

開発コスト/期間を削減するGUI操作中心のジョブ開発

 DataStageに備わるこうした特徴は、実際に使ってみるとすぐに実感できる。特にユーザー・インタフェースに関しては、GUI上で視覚的にデータ・フローを把握でき、ドラッグ&ドロップ操作主体でジョブ開発が行える点が大きなアドバンテージとなっている(画面1)。

DataStageの画面
画面1:ドラッグ&ドロップ操作主体でジョブ開発が行えるDataStageの画面

 ジョブの開発にあたっては、テーブル定義などのメタデータを取り込んだうえで、アイコン化された部品を選んで画面上に配置していく。そして、その部品をリンク線で結んでデータの流れを定義し、各部品のプロパティ情報を設定する。

 このジョブは、コマンドラインからの実行のほか、「JP1」のような運用管理ツールから実行することもできる。また、HTML形式のジョブ・レポートを自動生成する機能も備え、スタイル・シートの定義によるカスタマイズにも対応している。この機能によって、保守用ドキュメントとしてのジョブ設定書の作成/修正工数を大幅に削減することができる。

 DataStageを採用したあるメーカーのSCM支援分析システムの事例では、ETL機能を手作りで開発した場合と比べ、5人で開始した初期開発は、期間が6カ月から2カ月に短縮され、保守/拡張時の要員は3人から1人に変更することができ、要員、開発期間、コストの大幅な削減を達成している(図2)。

あるメーカーにおけるDataStage適用の効果
図2:あるメーカーにおけるDataStage適用の効果

包括的にDataStage活用を支援する日立の取り組み

 日立製作所は、1999年からDataStageの販売パートナーとしてのみではなく、製品開発元と開発パートナーとして協業してきた。製品の日本語化やベータ版からの品質テストを日立が担当してきたほか、日立のスケーラブルデータベース「HiRDB」や日立ストレージシステムとの連携部品を自社開発している。また、DataStageを導入している国内企業のほぼ半数は日立からの提供によるものだ。

 そして、製品エディションにも、日立独自のものが用意されている。それは、「DataStage Standard Edition」と同等の機能を備えながらも、中堅企業や病院、学校、地方自治体などに提供される「DataStage Common Edition」である。このエディションは、2008年3月までのキャンペーン製品として、514万5,000円からという価格で提供される。

 コンサルティングやサポートについても、日立はしっかりとした体制を整えている。コンサルティングでは、DataStageの導入を支援する設計/開発サービスや、運用開始後の性能改善サービスなどのメニューを用意している。加えて、DataStageの導入効果を実感できる「DataStage体験セミナー」の開催や、操作トレーニングなどの技術支援も行っている。

 また、多数の導入実績や開発協業を通して培った豊富な製品知識やノウハウに基づいたサポートサービスにより、問い合わせに対して迅速・正確に応えることができる。加えて、米国IBMのDataStage開発部隊との緊密なリレーションシップによって、迅速に解決策を提示できる体制が整っている。

 前述したように、ETLツールには業務システムの変更/拡張に対し継続的に対応していくことが求められる。製品の開発から販売、コンサルティング、サポートに至る包括的な取り組みで、ユーザーの情報資産管理基盤の構築を支援していくという日立の姿勢は、こうしたETLツールのあるべき姿を反映したものと言ってよいだろう。

無料体験セミナーのご案内

DataStageの操作を体感しよう!
データ統合基盤(ETLツール)DataStage実機体感セミナー

〜DataStageを使って売上実績データから販売集計を作成するバッチプログラムをつくろう〜

会場:品川イーストワンタワー13F ハーモニアス・コンピテンス・センタ内「Etude Tokyo」

詳しい情報とお申し込みは下記URLから。
http://www.open-middle.com/hitachi/DataStage/

問い合わせ先

株式会社 日立製作所
【製品販売元】
株式会社 日立製作所
ソフトウェア事業部販売企画センタ
〒104-8573 東京都品川区南大井6-26-2 大森ベルポートA館
TEL:03-5471-2592
URL:http://www.hitachi.co.jp/datastage/
【製品開発元】
日本アイ・ビー・エム株式会社

※DataStageは、IBM Corporationの商標です
※本文中の会社名および製品名は、各社の商標または登録商標です

▲ページの先頭へ戻る