【 ここから本文 】

メール管理

ソーシャルブックマークに登録 : Yahoo!ブックマークに登録 はてなブックマークに登録 del.icio.usに登録 newsing it!に登録 Buzzurlにブックマーク livedoorクリップに登録 Slashdotにタレコむ イザ!ブックマークに登録 Twitterでつぶやく
print 印刷用ページの表示


大容量データ時代の
バックアップ新標準「データ・デデュープ」

バックアップ容量を大幅に削減する新技術のメカニズムを知る

(2007年10月16日)

ストレージ業界では現在、「データ・デデュープリケーション」という“ホット”なバックアップ技術に注目が集まっている。今年に入ってから市場投入された製品群の数を見ても、この技術に対する注目度は明らかと言えるだろう。本稿では、「データ中の重複を除外する」という意味を持つこの技術が注目される背景やメカニズム、ユーザー企業にとっての導入メリットなどについて解説する。

菊地宏臣
SNIA日本支部 副会長/DMFエバンジェスト

2007年は
デデュープ技術元年の年

 SNW(Storage Networking World)は、米国で年2回開催されているストレージ業界最大規模のコンファレンスである。その講演タイトルを調べてみると、昨年10月にフロリダ州オーランドで開催されたSNW Fall 2006では「データ・デデュープリケーション(De-duplication、以下、デデュープ)」という言葉を含む講演はなかった。しかし、今年4月にカリフォルニア州サンディエゴで開催されたSNW Spring 2007では、2つの講演にデデュープという言葉が記されている。

 「De-duplication」という英単語は、1語の単語「deduplication」として使うこともできるのだが、この言葉が「de(〜から離れて、 除去して)+duplication(重複)」という構造を持っていることを明確にするために、あえて「-」(ハイフン)を入れて記述される場合も多い。日本では、「重複除去」、「重複除外」、「重複回避」などの訳語が用いられているが、まだ定着した呼び方はないようだ。

 この言葉が今年に入って広まり始めたのは、情報の爆発的増大などのITにおける懸案事項を解決する可能性が高いとして注目度が上昇していることによるものだと考えられる。これについては後述しよう。

共通する部分を除外することで
保存するデータ量を削減

 SNW Spring 2007の講演の1つでは、デデュープを次のように定義していた。「データセット中のデータの冗長部分(チャンク)の認識と除外(除去)」(Identification and elimination of redundant chucks of data inside a data set)。

 このデデュープ技術の基本的な考え方を図示したのが図1である。最初のバックアップ・データに対し、変更を加えたデータの中で共通している部分を除外するのがポイントである。その共通データと共通していないデータ部分との関連性を管理すれば、保存するデータ量を減らすことができる、というものだ。


図1:デデュープ技術の概要

 これはバックアップ前後のデータセットについての例であるが、 同じようなファイル/データが複数のサーバやクライアントPCに散在しているであろう一般的な環境に当てはめると、非常に大きなデータ量削減効果が見込めそうだということが想像できるだろう。SNW Spring 2007での講演では、データ削減効果は、2分の1から100分の1と紹介されていた。

 ちなみに、デデュープ技術を「データ量を減らすための技術の1つ」とする見方もある。例えば、全体的にデータ量を減らす「データ圧縮」という手法が、そうした技術の代表格と言えるだろう。それに対して、デデュープ技術は「もともとのデータとその変更点だけを抽出する」という、これまでとは異なる観点でデータ量を減らす技術と言うことができる。

 デデュープ技術をわかりやすい例えで言うとこうなる。複数の書類が章立てされて綴じられた1つの文書があるとする。文書の変更後に、すべてコピーし直すのがフル・バックアップ、それに対して、変更されたページだけをコピーするのが差分バックアップだ。変更された文字の部分だけをコピーして保存する──これがデデュープ技術である。これら3つを比較すると、コピーの量は、1冊単位(フル・バックアップ)から、ページ単位(差分バックアップ)、そして、文字単位(デデュープ技術)となって、コピー量が格段に少なくなるというメカニズムだ。


 |123 > 次のページへ



関連記事

▲ページの先頭へ戻る


注目のリポート/ホワイトペーパー

フレームワーク化されたサプライ・チェーン・プロセスを導入すれば、ビジネス・パフォーマンスはさらに向上する

フレームワーク化されたサプライ・チェーン・プロセスを導入すれば、ビジネス・パフォーマンスはさらに向上する

企業の持続的な成長のためには、サプライ・チェーンの最適化が不可欠

調達から支払いまでのプロセスを“見える化”し、財務サプライチェーンを合理化する

調達から支払いまでのプロセスを“見える化”し、財務サプライチェーンを合理化する

現在のプロセス状況を可視化し、改善ポイントを見つけることがカギ

「UTM」実践導入ガイド

「UTM」実践導入ガイド

巧妙化するあらゆる攻撃からネットワークを守る

「リアルタイムLANアナライザ」とは?

ネットワーク・トラブルにまつわる諸問題を解決する「リアルタイムLANアナライザ」とは?

高いコスト・パフォーマンスと操作性――最新製品に備わる特徴と機能

Windows Server 2008 対応製品(ソフトウェア関連)

SOA/BPM 関連製品

注目のトピック

ワークスタイル革新[New]
業務生産性の向上とワーク・ライフ・バランスの実現を目指して
事業継続マネジメント(BCM/DR)[Update]
万全のBC/DR基盤を構築し企業の信頼を高める
マルチコア・コンピューティング[Update]
ITインフラを最適化しパワーを最大限に生かす
グリーンITの戦略的価値
“環境マネジメント”の視点でITを最適化する
仮想化の“真実”
IT革命を支えるテクノロジー
データセンター革新
次世代ITインフラをいかに構築すべきか
ビジネス・インテリジェンス最新事情
組織と“個”の知的生産性を高める
セキュリティ・マネジメント[戦略と実践]
内外の脅威から企業を守る
Windows Server 2008 World
新世代プラットフォームの実力を探る
コンプライアンス総点検
法令順守の実態を把握し、万全の対策を!
SOAがITを変える
企業はどう備えるべきか
ITIL活用最前線
ITILでビジネスとITを変える
データ・マネジメント
新時代の情報/データ管理基盤を構築するために

Weekly Ranking

集計期間:11/28〜12/04


トピック一覧

ニュース特集

セキュリティ

ソフトウェア&サービス

経営/業務改革

ITマネジメント

データ・マネジメント

プラットフォーム

IT基盤技術

ハードウェア

ネットワーキング

トレンド

IT業界動向


Computerworld Global
米国
英国
中国
ドイツ
オーストラリア
シンガポール
その他の国