【 ここから本文 】
データ・マネジメント
ソーシャルブックマークに登録 :
印刷用ページの表示
【解説】
データ量削減の新アプローチ
「リアルタイム・データ圧縮」の効能を知る
ILMを補完する新技術を活用し、ストレージの効率化を推進せよ
(2008年04月03日)
プライマリ・ストレージへのデータ圧縮技術が登場
こうしたなか、プライマリ・ストレージへのデータ圧縮(リアルタイム・データ圧縮)技術が登場し、2007年ごろから認知度が上がってきた。プライマリ・ストレージでデータ圧縮を行う際には、リアルタイム性が非常に重要になる。加えて、データ圧縮においては、ユーザーのシステム環境の変更や追加のオペレーションなどが発生しないという条件が求められる。こうしたプライマリ・ストレージ環境の要件を満たす技術を実現したのが、米国Storwizeである。現状、プライマリ・ストレージへのデータ圧縮技術は、業界で唯一Storwizeだけが実現しているものである。そのため、ここでは同社製品の技術や同社製品を利用したシステム構成を中心に、プライマリ・ストレージに対するデータ圧縮技術を解説していく。
| 写真1:Storwizeのリアルタイム・データ圧縮アプライアンス「STN-6000」 |
Storwizeは、データをリアルタイムで処理しつつ、ユーザーやシステムから透過的にデータ圧縮を行うために、アプライアンス・ベースのソリューションを採用している(写真1)。つまり、IAベースのサーバ・プラットフォームに独自のソフトウェアを搭載し、ポートなどをカスタマイズしたうえでハードウェアを設計している。
データ圧縮方式には、「Lempel-Ziv」というデータ圧縮アルゴリズムを採用している。Lempel-Ziv自体は特殊な技術ではないが、ファイル単位でデータを圧縮するのではなく、パケット単位でリアルタイム・データ圧縮を行うという点に、Storwizeの独自技術が集約されている。
プライマリ・ストレージへ格納されるデータを圧縮するためには、クライアントとNAS(Network Attached Storage)との間にアプライアンスを設置する必要がある(図2)。これにより、リアルタイム・データ圧縮を行っているが、圧縮の際には当然、少なからずオーバーヘッドが発生する。圧縮したデータを解凍する際にも同じことは言える。実際、Storwizeのアプライアンスでは、データ圧縮/解凍の際に80〜200μ秒のレイテンシ(遅延)が発生している。
| 図2:Storwizeのリアルタイム・データ圧縮アプライアンスを導入した際のシステム構成イメージ |
ファイルの圧縮/解凍時に若干のオーバーヘッドは発生するものの、ファイルサイズが圧縮されることでディスクへの書き込み/読み出し時間は逆に短くなる。すなわち、ディスクへのファイル読み書きによって発生するNASのオーバーヘッドが軽減されるわけだ。結果として、システム全体で見ると、アプライアンス導入前とほぼ同等か、環境によってはパフォーマンスの向上につながる場合もある。
また、圧縮といっても、アプライアンスに流れてくるすべてのデータを自動的に圧縮するのではなく、ポリシーを事前に設定しておくことで、ファイルの拡張子を識別して特定のファイルをパス・スルーする運用も可能だ。これは、「圧縮済みのファイルはむだに圧縮しない」という理由による。すでに圧縮されたファイル(JPEG、MPEGなど)をアプライアンスで圧縮しようとしても、その効果がほとんど得られないからだ。
むだに圧縮処理をしてしまうと、その分余計なオーバーヘッドが発生してしまう。アプライアンスでは、このような状況を避けるために、ファイルのシェア・フォルダおよび拡張子単位で、圧縮のオン/オフを設定できるようになっている。圧縮効果が得られないファイルは何もせずにパス・スルーし、余計な負荷をアプライアンスにかけない仕組みだ。こうした機能は、リアルタイム・データ圧縮を行ううえでは必須と言えるだろう。
アプライアンスの導入に際しては、既存のNASをそのまま活用できるうえ、NASに保存されている非圧縮データに関しても、アプライアンスを介した読み書きに支障はきたさない。導入はプラグ・アンド・プレイに近く、圧縮ポリシーの設定を行った後は、NASの前段ネットワークにアプライアンスを接続するだけである。ネットワーク機器やアプリケーション、サーバからNASに至るまで、設定を変更する必要はない。もちろん、NASにアクセスしているクライアントからアプライアンスの存在は認識されず、従来どおりにアクセスできる。
得られる5つのメリット
プライマリ・ストレージへリアルタイム・データ圧縮を行うことで、直接的/間接的に得られるメリットは大まかに言って5つある。
(1) データ増加率の抑制
データを圧縮することで、ストレージ容量の増加スピードを抑制できる。そのため、ストレージの購入サイクルに余裕ができ、長期的なプランの立案が可能になる。
(2) NASのパフォーマンス向上
データが圧縮されると、NAS上でのCPU処理負荷が軽減し、NASのパフォーマンスが向上する。それにより、場合によっては、アプライアンスとNASの中位機種の組み合わせで、高機能(大容量)NASに匹敵する容量/性能を得ることも可能になる。
(3) 省スペース化
ストレージに限らず、サーバやネットワーク機器が増加し、スペースの確保に苦慮しているデータセンターやサーバ・ルームは多い。データを圧縮するとストレージの台数削減が可能になり、従来より小規模なストレージで運用できるようになるため、省スペース化が図られる(図3)。
| 図3:アプライアンスを導入することで、ストレージ台数を減らすことができる。仮にデータが3分の1に圧縮されれば、ストレージ容量も3分の1になる |
(4) ストレージ・システムの省電力化
NAS内のHDDは、高速アクセスを実現するために未使用領域も常時アイドリングを行う必要があり、台数が増加したり、大容量化すればするほどアイドル中のHDDが増加し、電力消費量が大きくなる。ともすれば大規模化しがちなストレージ・システムへアプライアンスを導入すれば、導入台数の削減やワン・ランク下のNASを利用できるため、省電力化が実現される。大容量ストレージにかかる空調電力も含めると、その省電力効果は決して小さくない。
データセンター全体で見ても、IT機器の増加に伴う電力消費量の増大で、発電所との契約電力量が限界に近づきつつある。こうした状況にあって、プライマリ・ストレージへのデータ圧縮は、ストレージの“グリーン化”に大きく貢献する技術なのである。
(5) DRに伴う通信コストの抑制
データ圧縮により、DR(Disaster Recovery:災害復旧)対象のデータが小さくなり、結果として通信コストを抑制できる。
以上のようなメリットが考えられる。ただし、こうしたメリットは、扱うデータ量が多いユーザーが使って初めて効果を発揮する。もともと扱うデータ量が少なければ、アプライアンスの導入コストと釣り合わなくなるからだ。そのため、現状では、リアルタイム・データ圧縮アプライアンスは大企業向けソリューションと言わざるをえない。
























