【 ここから本文 】

ストレージ革命

ソーシャルブックマークに登録 : Yahoo!ブックマークに登録 はてなブックマークに登録 del.icio.usに登録 newsing it!に登録 Buzzurlにブックマーク livedoorクリップに登録 Slashdotにタレコむ イザ!ブックマークに登録 Twitterでつぶやく
print 印刷用ページの表示


ストレージ革命

大容量データ時代の
バックアップ新標準「データ・デデュープ」

バックアップ容量を大幅に削減する新技術のメカニズムを知る

(2007年10月16日)

ストレージ業界では現在、「データ・デデュープリケーション」という“ホット”なバックアップ技術に注目が集まっている。今年に入ってから市場投入された製品群の数を見ても、この技術に対する注目度は明らかと言えるだろう。本稿では、「データ中の重複を除外する」という意味を持つこの技術が注目される背景やメカニズム、ユーザー企業にとっての導入メリットなどについて解説する。

菊地宏臣
SNIA日本支部 副会長/DMFエバンジェスト

2007年は
デデュープ技術元年の年

 SNW(Storage Networking World)は、米国で年2回開催されているストレージ業界最大規模のコンファレンスである。その講演タイトルを調べてみると、昨年10月にフロリダ州オーランドで開催されたSNW Fall 2006では「データ・デデュープリケーション(De-duplication、以下、デデュープ)」という言葉を含む講演はなかった。しかし、今年4月にカリフォルニア州サンディエゴで開催されたSNW Spring 2007では、2つの講演にデデュープという言葉が記されている。

 「De-duplication」という英単語は、1語の単語「deduplication」として使うこともできるのだが、この言葉が「de(〜から離れて、 除去して)+duplication(重複)」という構造を持っていることを明確にするために、あえて「-」(ハイフン)を入れて記述される場合も多い。日本では、「重複除去」、「重複除外」、「重複回避」などの訳語が用いられているが、まだ定着した呼び方はないようだ。

 この言葉が今年に入って広まり始めたのは、情報の爆発的増大などのITにおける懸案事項を解決する可能性が高いとして注目度が上昇していることによるものだと考えられる。これについては後述しよう。

共通する部分を除外することで
保存するデータ量を削減

 SNW Spring 2007の講演の1つでは、デデュープを次のように定義していた。「データセット中のデータの冗長部分(チャンク)の認識と除外(除去)」(Identification and elimination of redundant chucks of data inside a data set)。

 このデデュープ技術の基本的な考え方を図示したのが図1である。最初のバックアップ・データに対し、変更を加えたデータの中で共通している部分を除外するのがポイントである。その共通データと共通していないデータ部分との関連性を管理すれば、保存するデータ量を減らすことができる、というものだ。


図1:デデュープ技術の概要

 これはバックアップ前後のデータセットについての例であるが、 同じようなファイル/データが複数のサーバやクライアントPCに散在しているであろう一般的な環境に当てはめると、非常に大きなデータ量削減効果が見込めそうだということが想像できるだろう。SNW Spring 2007での講演では、データ削減効果は、2分の1から100分の1と紹介されていた。

 ちなみに、デデュープ技術を「データ量を減らすための技術の1つ」とする見方もある。例えば、全体的にデータ量を減らす「データ圧縮」という手法が、そうした技術の代表格と言えるだろう。それに対して、デデュープ技術は「もともとのデータとその変更点だけを抽出する」という、これまでとは異なる観点でデータ量を減らす技術と言うことができる。

 デデュープ技術をわかりやすい例えで言うとこうなる。複数の書類が章立てされて綴じられた1つの文書があるとする。文書の変更後に、すべてコピーし直すのがフル・バックアップ、それに対して、変更されたページだけをコピーするのが差分バックアップだ。変更された文字の部分だけをコピーして保存する──これがデデュープ技術である。これら3つを比較すると、コピーの量は、1冊単位(フル・バックアップ)から、ページ単位(差分バックアップ)、そして、文字単位(デデュープ技術)となって、コピー量が格段に少なくなるというメカニズムだ。


 |123 > 次のページへ



関連記事

▲ページの先頭へ戻る


特別企画

日立のストレージ・ソリューション

柔軟なデータ・マネジメント戦略でビジネスを加速させよ

“仮想化”を基盤とした総合力で、情報資産の活用を支援する日立製作所のストレージ・ソリューション

イベント・リポート

NetApp Focus 2008

競争力の高いデータ管理基盤をいかに構築するか――ネットアップが提示する仮想化活用の実際

データ管理における豊富なノウハウに基づくNetAppストレージ/仮想化製品群

プロダクト・フォーカス

日立製作所

データを安全に長期保管し、さらなる活用を促す――日立の「Hitachi Content Archive Platform」

コンプライアンス/内部統制時代のニーズに応えるコンテンツ・アーカイブ・ストレージ

キーパーソン

「ストレージ管理の課題解決のカギは重複除外と仮想化」――ネットアップCTOのポロウスキー氏

社名変更し、ユーザー認知度のさらなる向上も目指す

サンEVPのファウラー氏「ストレージでもオープン革命を起こす」

「サーバ/ネットワーク/ストレージは、オープン技術によって統合化・収束化に向かう」

ストレージにも「グリーン」を――SNIAが示す環境配慮の新指標

エネルギー効率を測定できる新ストレージ指標を2009年完成に向け開発中

「目指すのは、日本社会に根づいた“情報インフラ企業”」――EMCの諸星社長

製品の単なる“日本語化”ではなく“日本化”を目指す

データ統制

オンライン・バックアップ・サービスの普及が大手企業間で加速

有力ベンダーが相次いで市場参入。2011年には約7億ドルの市場規模に

ILMの導入で、IT運用コストを引き下げろ!

ILMを成功裏に導入するための“6つのステップ”

全社レベルでコンテンツを“統制”する「ECM」

今日のコンテンツ管理製品分野における最注目領域

過去のあらゆるデータをリカバリできるデータ保護技術「CDP」

データ・ロスとダウンタイムの最小化をも実現

コンプライアンスを重視したメール運用管理の実際

ECM/CMSではカバーしきれない最重要コンテンツ

ストレージ仮想化

ストレージ仮想化[メリットと手法を確認する]

普及が進み、成熟期を迎えた仮想化技術

注目集めるストレージ仮想化技術――企業は管理コスト削減に期待

管理コストを95%削減した事例も

ストレージ管理

ストレージ・リソース管理(SRM)ソフトは使い物になるか?!

有用なチャージバック・モデル開発など、課題が山積

少ない電力でより多くのデータをストア

ストレージ管理の「今日的キーワード」は「省電力」

企業が陥るストレージの過剰購入

リソース管理ソフトを駆使して計画的な導入を!

「シン・プロビジョニング」でストレージ・リソースの“無駄づかい”を撤廃する

手付かずの容量を有効活用するためのアプローチ

ユーザー事例

ニューヨーク市警の巨大データ・ウェアハウス刷新計画とは

関連機関の“データ・ハブ”として機能

中堅化学薬品メーカーが体感した「iSCSI SAN」の導入効果

災害復旧バックアップ基盤を強化

キャッチアップ

ITILを生かしたストレージ管理の新アプローチ

ベスト・プラクティスをストレージ管理にも応用し、“データの洪水”に備える

ナノテク研究の前線からCPU/HDD/メモリの明日を読む[HDD編]

テラバイト領域に突入したハードディスク――垂直磁気記録方式、TMRヘッド、パターンド・メディア……

データ・バックアップの定番デバイス「テープ・ストレージ」の意義を再考する

容量/データ転送速度の向上に加え、セキュリティも強化

エンタープライズ・レベルに達したiSCSI

急速に普及するiSCSI-SAN。その技術の成熟度を測る

トレンド・ウォッチ

グリーン化を実現するために、コールセンターを「仮想化」せよ

在宅勤務を取り入れれば、オペレーターの定着率がアップし、省エネも達成

待たれる、「相変化メモリ(PCM)」時代の到来

小型化の限界に近づいたフラッシュ・メモリに、いつ取って代わるのか

ISO/IEC、マルチベンダー環境のSAN管理仕様「SMI-S」を承認

SANシステムの相互運用を実現

大半の企業は「電子開示」規則への対応が不十分

民事訴訟での電子文書の証拠提出を巡り

【連載】バックアップ新論

第1回:デスクトップのバックアップ

第1ステップはユーザーへの喚起

第2回:データセンターのバックアップ

まずは経営上のリスクとコストとのバランスを評価

第3回:メッセージのバックアップ

内部統制に必須の重要課題に取り組む

第4回:ワークグループのバックアップ

「バックアップの盲点」をいかに克服するか

第5回:PDAのバックアップ

ネットワーク・デバイスとして管理する

第6回:ブランチ・オフィスのバックアップ

常に変化する“標的”を的確に“キャッチ”する

Weekly Ranking

集計期間:11/25〜12/01



Computerworld Global
米国
英国
中国
ドイツ
オーストラリア
シンガポール
その他の国