【 ここから本文 】
データ・マネジメント
ソーシャルブックマークに登録 :
印刷用ページの表示
【解説】
データ量削減の新アプローチ
「リアルタイム・データ圧縮」の効能を知る
ILMを補完する新技術を活用し、ストレージの効率化を推進せよ
(2008年04月03日)
DB関連データでは80%の圧縮も可能に
プライマリ・ストレージへのリアルタイム・データ圧縮は、アプリケーションに特化したソリューションではないため、どのようなNAS環境でも基本的に導入できる。例えばStorwizeの場合、導入事例としてはCAD/CAM系やデータベース系のユーザーが多い。ただし、先にも述べたが、圧縮済みのファイルを多く抱えるユーザーには、プライマリへのデータ圧縮は適さない。
こうした点を考慮すると、ディスク内にどういった種類のデータがあるかを事前にチェックする必要がある。しかし、複雑化したストレージ環境において、ディスク内のデータをユーザーが自力でチェックすることは容易ではない。そのため、Storwizeでは、「PrediSave」というアプライアンスの導入効果予測ツールを提供している。
このツールを使えば、ファイル拡張子の種類やその割合、ファイル・サイズ、予測される圧縮効果などを確認することができる。これにより、実際にアプライアンスを導入した際、どれほどのストレージ領域をセーブできるかが予測可能となり、ROI(Return On Investment)の計算もしやすくなる。
データ圧縮率はデータの種類により異なってくるが、Oracle DatabaseといったDB関連データの圧縮率は高く、約80%を達成している。簡単に言ってしまえば、100GBのDBファイルが20GBまで圧縮されるということだ。その効果の大きさは容易に想像がつくだろう。
ILMを補完するリアルタイム・データ圧縮
これまでストレージのILM(Information Lifecycle Management)は、セカンダリおよびアーカイブ・ストレージにおいてデータ量を圧縮/削減するソリューションを利用し、より効果的な運用を行っていた。例えば、最近話題のデデュープも、あくまでバックアップ用途で使うソリューションである。なぜなら、先に述べたように、プライマリでデデュープを使用するにはあまりにもパフォーマンスに問題があるからだ。
デデュープは、保存対象のデータに対して、先に保存したデータと重複する部分を探し出し、データ保存の際に重複部分を除外する技術である。この一連の作業は、ストレージに一定の負荷がかかってしまい、パフォーマンスがどうしても低下してしまう。そのため、バックアップ用途がメインなわけだ。
ただし、一部バックエンドに利用されているデデュープもある。深夜の空き時間を利用してデータの重複除外を行っているのだが、ファイル容量が大きなユーザーにとっては、深夜だけで重複除外作業が完了しないケースが多く、やはりプライマリ・ストレージでの利用には無理があると考えざるをえない。
このように、従来のILMでは、バックアップ・ストレージでデータ量を圧縮/削減していくのが普通だった。プライマリ・ストレージへのデータ圧縮は行われてこなかったわけだが、これは単にそれを実現するソリューションが存在しなかっただけの話である。今後は、リアルタイム・データ圧縮とバックアップ用途でのデータ圧縮ソリューションとを組み合わせて、より効果的なILMが実践されていくと予想される(図4)。
| 図4:リアルタイム・データ圧縮アプライアンスを生かしたストレージのILMの例 |
ストレージ・システムは新たなステージへと突入
現在、データの増加率を予想することは非常に難しい。仮にストレージの償却期間を5年と設定した場合、ストレージ容量はかなりの余裕を持たなければならず、実際のストレージ使用量よりも多くのストレージ容量を購入する必要がある。このことは、大型ストレージの導入にもつながってくる。
これに対し、リアルタイム・データ圧縮アプライアンスを利用すれば、小・中規模ストレージからのスモール・スタートが可能になる。その後のストレージの追加投資も、よりやりやすくなる。こうしたメリットは今後、市場に受け入れられていくはずだ。
また、企業がグリーンITを考えるうえでも、ストレージ容量を削減できるリアルタイム・データ圧縮は必要な技術となってくるだろう。もちろん、アプライアンスの稼働に伴い電力消費量は増加するが、ストレージ台数の削減効果を考慮すれば微々たるものである。
これまで述べてきたメリットを勘案すると、リアルタイム・データ圧縮アプライアンスの市場潜在性は非常に高いと考えられる。それゆえ、今後は、Storwize以外にもさまざまなベンダーが新規参入してくることだろう。実際、そうした動きも徐々に出てきている。
しかし、リアルタイム・データ圧縮は新しいカテゴリーであるため、現在、市場での認知度は決して高くない。さらに、技術的にも全ベンダーのNASに対応しているわけではなく、こうした未成熟さも残っている。今後はSAN(Storage Area Networks)への対応も求められてくるだろう。
課題は残されているものの、リアルタイム・データ圧縮の登場意義は大きい。この圧縮技術が登場したことで、ストレージ・システムはILMの新たなステージへ突入したと言えるはずだ。
























