無償/オープンソースのデータウェアハウス・ソフトに注目しよう
複数のDWHベンダーが提供開始、用途によっては企業でも十分活用可能データウェアハウジング(DWH)ソフトウェアといえば、非常に高価なものというイメージがある。だが最近、一部のDWHベンダーが無償版の製品をリリースし始めている。機能制限があるものの、用途によっては十分に利用価値があるといえるだろう。
データウェアハウジング(DWH)のソフトウェア・システムは非常に高価だ。だが、高い対価を支払ってでも、多くの企業はDWHを導入したいと考える。それは、DWHにより自社のビジネスを新たな視点から分析することが可能になり、競争上の優位性をもたらすと期待されているからだ。
今年初頭に調査会社のIDCが発表したレポートによると、2009年のDWHプラットフォーム市場はおよそ79億ドル規模である。これが、4年後の2013年には108ドル規模にまで成長すると予測されている。
DWHは導入したいが、その予算はとても確保できない――そんな企業に朗報がある。近ごろ、強力なデータ処理能力を備えた、無償版のDWHソフトウェアが相次いで登場しているのだ。
今年10月、米国のDWHベンダーGreenplumはシングル・ノード版のMPP(超並列処理)データベースを発表した。MPPアーキテクチャは、1件のデータ処理作業を複数の独立したクエリに分割し、大量のサーバで並列/分散処理させる仕組みだ。
Greenplumのシングル・ノード版データベースは、x86サーバの台数が1台まで(CPUソケットは2つまで、コア数は無制限)という制限があるが、企業の実務にも十分対応できる。また、仮想マシン(1インスタンス、仮想コア数8個まで)上で稼働させることも可能で、ストレージ容量の制限はなく、同社の各種実装とも連係可能だ。
同じく10月には、米国Calpontも列指向データベース「InfiniDB Community Edition」をオープンソースでリリースしている。Monash Researchのアナリスト、カート・モナシュ(Curt Monash)氏によると、列指向データベースは、行指向データベースに比べディスクI/O負荷が少なく、より高いレベルの圧縮が可能だという。
Calpontが有償で販売しているInfiniDBは複数台のサーバに展開できるが、InfiniDB Community Editionは1台のサーバでしか実行できないという制限がある。ただし、CPUやコア数、メモリ容量、データ量、同時利用ユーザー数は無制限だ。
InfiniDB Community Editionと同様のDWHプラットフォームは、昨年米国Infobrightからもリリースされている。Infobrightは、コミュニティ・サポートの面でInfiniDBよりも一歩リードしている。Infobrightによれば、このソフトウェアのダウンロード件数は1万5,000件を超えているという。
モナシュ氏によると、無償で入手可能なこれらのDWHソフトウェアには、それぞれに制約と最適な利用シナリオがあるという。
「1人のアナリスト、あるいは小規模なアナリスト・チームが数テラバイト程度のデータを解析し、初期段階の調査を行っているような場合には、これらの製品も有効に活用できる」(モナシュ氏)
さらにモナシュ氏は、調達予算がなかったり、予算を確保するために事前の概念実証が必要だったりする場合にも有用だと付け加えた。
「これらの(無償の)製品では作業負荷に対応できない場合もあり、将来的に有償版の製品を購入する必要に迫られる可能性もある。それでも、自社のデータを活用していくうえで、これらの無償版DWHソフトは良い出発点になるだろう」(モナシュ氏)



























