EMC、買収したグリーンプラムの技術に基づく高速DWHアプライアンスを発表|企業内情報活用|トピックス|Computerworld

CW_Welcomeバナー

header_cwr_head_mid_fl_logo

CW_ADJUST_ウルトラバナー

CW_ウルトラバナー_Topics02

CW_ウルトラバナー_Topics04

CW_ウルトラバナー_Topics05

CW_ウルトラバナー_Topics06

CW_ウルトラバナー_Topics07

CW_ウルトラバナー_Topics08

企業内情報活用

RSS

EMC、買収したグリーンプラムの技術に基づく高速DWHアプライアンスを発表

大規模データ管理用の「Greenplum Data Computing Appliance」
(2010年10月14日)

EMCが発表したデータ・ウェアハウス・アプライアンス「EMC Greenplum Data Computing Appliance」

 米国EMCは10月13日、深刻な課題になっている大規模データ管理への対応を目指したデータ・ウェアハウス(DWH)アプライアンス「EMC Greenplum Data Computing Appliance」を発表した。このアプライアンスは、大量データを超高速で取り込めるように設計されている。

 Greenplum Data Computing Applianceでは、EMCが7月に買収を発表したGreenplumが開発したMPP(超並列処理)技術が利用されている。

 EMCは、「このアプライアンスは競合製品の2倍の速度でデータをロードできる」と強調している。同社が競合製品として挙げるのは、米国Oracleの「Exadata」、米国IBMが買収した「Netezza」、米国TeradataのエンタープライズDWH製品だ。EMCによると、1ラック構成のGreenplum Data Computing Applianceによるデータ・ロード性能は1時間あたり10TB(テラバイト)だという。

 Greenplumで社長を務め、現在はEMCで製品担当副社長を務めるスコット・ヤラ(Scott Yara)氏は、「このアプライアンスは大量のデータからインテリジェンスを導き出そうとする組織向けに販売される」と語った。

 「ネットワーク上やWeb上で稼働するマシンが、かつてない大量のデータを生み出している。携帯電話やセンサ・ネットワーク、ルータは、日々膨大なイベントを発生させている。こうした入力情報の意味を理解するために、企業は、従来は必要がなかったデータ分析インフラの構築を迫られている」(ヤラ氏)

 Greenplumは、高速なデータ・ロードを実現するため、ハイパフォーマンス・コンピューティング(HPC)分野で長年利用されてきた並列処理アーキテクチャを採用している。

 ヤラ氏の説明によると、ほとんどのDWHアプライアンスには1つのマスター・ノードがあり、すべてのデータがそこから入力されなければならないという。このアプローチは、大量のデータを高速にインポートしようとする場合にボトルネックになるおそれがある。これに対し、GreenplumのMPPアプローチでは、ラック上の各サーバに専用のEthernet接続が用意される。

 「データを1つのシステムにロードし、それを分散しようとするのではなく、Greenplumのアーキテクチャは、クラスタ内のすべてのサーバにデータを並列にロードする」と、ヤラ氏は語った。これらのサーバはピアツーピア方式で相互に調整し、すべてのノード間でデータを分散してバランスを取るという。

 また、このMPPアーキテクチャでは、データ分析をサーバ間で並列に実行できる。「1つのクエリをすべてのマシンで分散処理できる」(ヤラ氏)。

 Greenplum Data Computing Applianceは、DWH用データベース・エンジン(Greenplum Database 4.0)を搭載したサーバ群にストレージとネットワーキングを統合したもので、発表と同時に出荷が開始された。1つのラックには、米国Intelの6コア・プロセッサ「Xeon E5670」をそれぞれ2個搭載するサーバが16台収容される。このアプライアンスはハーフ・ラック、シングル・ラック、複数ラックの構成が可能。各ラックで最大36TBの非圧縮データを保存でき、24ラックで最大5PB(ペタバイト)の圧縮データを保存できる。24ラック・システムでは、最大で合計4,608のデータベース・コアが稼働する。

 EMCは、アプライアンスという形態には多くのメリットがあると強調している。また、Greenplum Data Computing Applianceは、EMCのバックアップ/リカバリ・ソフトウェア「Data Domain」と組み合わせて利用できる。このソフトウェアにより、DWHの内容をEMC SANにバックアップしたり、同アプライアンスの追加ストレージ用にSANを利用したりできる。

 さらに、必要があれば、EMCの「RecoverPoint」ソフトウェアを使って、SANからのデータで2次DWHを構築することもできる。

 「このRecoverPointの併用による機能は、大きな差別化要素だと思う」と、米国New York Stock Exchange EuronextのGlobal Data Services部門の最高データ責任者兼シニア・バイス・プレジデント、スティーブ・ハーシュ(Steve Hirsch)氏は、EMCが13日にニューヨークで行った製品発表イベントで語った。現在、ほとんどの企業は、バックアップのためにDHWの完全な2次インスタンスを作成しなければならないが、そのメンテナンスのために多くの人的およびハードウェア・リソースが必要になりがちだと、同氏は説明した。

 Euronextは2007年からGreenplumのソフトウェアを使ってきた。Euronextでは、内部オペレーションによって1日当たり4TB程度のデータが発生しており、Greenplumのデータベースは、このデータの一部からパフォーマンス指標を算定するために使われている。

 「われわれにとって、データを移動して分析するコストは非常に大きい。われわれとしては、データを一気にロードし、そこで分析し、分析データを提供する必要がある」(ハーシュ氏)

 EMCは、Greenplum Data Computing Applianceの発表と合わせて、Data Computing Products部門を新設したことも明らかにした。この部門は、Greenplumソフトウェアなどのデータ管理ソフトウェアを専門に手がける。

(Joab Jackson/IDG News Serviceニューヨーク支局)

記事詳細テキストバナー

ページの先頭へ戻る