ビッグデータの間違いを正す(後編)|ストレージ|トピックス|Computerworld

CW_Welcomeバナー

header_cwr_head_mid_fl_logo

CW_ウルトラバナー_Topics02

CW_ウルトラバナー_Topics04

CW_ウルトラバナー_Topics05

CW_ウルトラバナー_Topics06

CW_ウルトラバナー_Topics07

CW_ウルトラバナー_Topics08

ストレージ

RSS
【インタビュー】

ビッグデータの間違いを正す(後編)

ビッグデータ技術の可能性と限界――国立情報学研究所 佐藤一郎教授
(2012年01月19日)

 国立情報学研究所でアーキテクチャ科学研究系教授を務める佐藤一郎氏は、ビッグデータ活用の重要性と有効性を唱える1人だ。ただし同氏は、話題だけが先行するビッグデータの今の状況に疑問も呈している。ならば、ビッグデータの本質とは何なのか、そこからメリットを得るには何が必要とされるのか――。インタビュー後編では、ビッグデータ技術の可能性と限界に関する佐藤氏の見解を示す。

国立情報学研究所でアーキテクチャ科学研究系教授を務める佐藤一郎氏。同氏は、Computerworldのインタビューにこたえ、ビッグデータ技術の現状と課題について語った。

MapReduce/Hadoopは万能にあらず

――ここまで(前編では)、「ビッグデータとはそもそも何であり、なぜがその活用が求められるのか」、さらには「ビッグデータの利活用を行ううえでは何が必要とされるのか」を中心にお話を伺ってきました。ここからは少し切り口を変えて、ビッグデータの周辺技術(ビッグデータ技術)について伺いたいと考えます。

佐藤氏:まず、ビッグデータ技術は基本的に、「高度なデータ解析」と「大量/多様なデータ収集/処理」、および「高速データ処理/解析」をそれぞれ実現する技術から構成されます。

 このうち、高度なデータ解析を実現する技術としては、データ・マイニングや機械学習などの技術があります。また、高速なデータ処理/解析を実現する技術--すなわち、実世界のさまざまなデータと既知の特徴/パターンとの照合を高速に行う技術--には、「Complex Event Processing(CEP)」と呼ばれるインメモリ型のデータ処理の技術があり、そして、大量で多様なデータ収集/処理を実現する技術としては、昨今話題になっている「Hadoop/MapReduce」、キーバリュー・ストアといった技術が存在しています。

――現在、Hadoopに対する注目度が非常に高まっていますが。Hadoopは本当にビッグデータの処理、あるいは、ビッグデータの解析に有効なのでしょうか。

佐藤氏:Hadoopは、Googleが開発したMapReduceの互換技術です。ということでここでは便宜上、両技術を同一のものとして説明しますが、とにかくHadoop/MapReduceは非常にクセが強いテクノロジーで、当然のことながら万能の技術ではありません。

 例えば、GoogleはHadoop/MapReduceの技術をWeb検索時の前処理に当たるページのインデックス化のために用いており、Yahooはこの技術をテキストの構造化(タグ付け)のために利用しています。

 つまり、この技術はデータの前処理のためのものであって、データの解析技術ではないわけです。ところが今日では、多くの人がHadoop/MapReduceをデータ解析に用いようとしており、それが結果的にさまざまな苦労や失敗につながっているようです。

記事詳細テキストバナー

ページの先頭へ戻る