【 ここから本文 】
- TOP
- > Topics : 暗号化技術
- >
暗号化技術
ソーシャルブックマークに登録 :
印刷用ページの表示
【インタビュー】
「データ・シャッフリング」とは何か――開発者が説く新データ・マスキング技術
機密データのセキュリティ確保と分析への活用を両立
(2008年06月23日)
米国オクラホマ州立大学のテクノロジー・ビジネス・アセスメント・グループは先ごろ、「データ・シャッフリング」の研究プロジェクトに資金を提供すると発表した。データ・シャッフリングとはデータ・マスキング技術の1つであり、同大学経営科学・情報システム学部のラシンドラ・サラシー(Rathindra Sarathy)教授が中心となって開発を進めている。以下、データ・シャッフリングについて同氏に話を聞いた。
John Fontana
Network World米国版
――データ・シャッフリングについて、まずは簡単な説明をお願いしたい。
Sarathy氏:データ・シャッフリング(米国特許番号:7200757)はデータ・マスキング技術の一種であり、その目指すところは、機密の数値データを保護すると同時に、その分析値を保持することにある。
例えば、機密の給与データを社外のアナリストに提供するとしよう。アナリストの側では、「職務経験や学歴などのファクターが一定である場合に、男性と女性のマネジャーの給与に違いがあるか」、あるいは「年齢、性、職務経験、学歴、人種などの変数の中で、最も給与との相関が高いものは何か」といった項目の調査が目的だと考えてほしい。
もちろん、機密上の理由から、オリジナルの給与データをそのままアナリストに提供するなどもってのほかだ。しかし、オリジナルの機密データを提供する前に、個人の特定が可能な情報を削除したとしても、セキュリティは保証されない。大抵の場合、個人の属性を知っていれば、個人を特定するのはさほど難しくはないからだ。したがって、この例の場合には従来の暗号化技術は役に立たない。
そこで考えられるのが、アナリストに数字を渡す前に数字を変更する(マスキングする)アプローチだ。データ・シャッフリングでは、分析結果が正確なものになるような仕組みで、オリジナルの給与の数字を割り当て直すのである。同時に、オリジナルの給与の数字と個人を結び付けることができないようにする。
データ・シャッフリングが真価を発揮するのは、上に挙げた2番目の項目を調べるケースのように、機密の変数とそうでないものの両方を含む、さまざまな変数間の複雑な関係を維持したい場合だ。
――Googleで検索すると、このアプローチに言及したWebページが多数見つかる。現在、このアプローチはどれくらい注目されているとお考えか。
Sarathy氏:現在、さまざまな研究者がデータ・マスキングに取り組んでいる。ただし、データ・シャッフリングは、われわれが特許を取得した特殊なデータ・マスキング方法だ。われわれは、データ・シャッフリングは大きな可能性を持っていると考えている。
商用製品について言えば、データ・マスキング製品がいくつか市場で販売されている。しかし、それらはデータ・シャッフリングとは異なり、かなり単純なケースにしか対応していない。データを単にマスキングするだけでは、データ・シャッフリングと同等のデータ品質は保証されないのだ。
残念なことに、多くの企業は、データ・シャッフリングの威力や、このアプローチを利用することによる潜在的メリットを理解していない。そのため、われわれは向こう2年間、データ・シャッフリングの利点を広めることに精力的に取り組んでいくつもりだ。
――あなたは、データ・シャッフリングは最初に医療分野で定着するとみておられるようだ。ほかの分野ではどうなのか。
Sarathy氏:確かに、医療はわれわれが重要視する分野の1つとなっている。しかし、保険金請求データやそのほかの資金データの分析など、データ・シャッフリングが有効な分野はほかにもたくさんある。極論すると、機密データの分析や共有などのニーズがあれば、どんなケースでも利用できる。
データ・シャッフリングが商用製品としてはどんな形態になるかと言えば、単体のソフトウェア製品、ほかの製品(例えば表計算ソフトウェアなど)のアドイン、さらにはインターネット経由で提供されるXML Webサービスが考えられる。この3種類すべてのプロトタイプ開発が進められており、初期テストは成功した。
【RSA Conference 2008】業界のビッグネームたちが語る、情報セキュリティ対策の“勘所”


対策のカギは「情報中心型セキュリティ」のアプローチにあり
【インタビュー】“元ホワイトハウスCSO”ハワード・シュミット氏が語る「今、ここにあるセキュリティ危機」


プライバシーとセキュリティのバランス/RFIDパスポートの問題点/企業によるITワーカーの素行調査……
構造化/非構造化を問わず、あらゆるデータからトレンドを得る




