ビッグデータの間違いを正す(前編)
ビッグデータで競争力を得るための真の道筋とは――国立情報学研究所 佐藤一郎教授国立情報学研究所でアーキテクチャ科学研究系教授を務める佐藤一郎氏は、ビッグデータ活用の重要性と有効性を唱える1人だ。ただし同氏は、話題だけが先行するビッグデータの今の状況に疑問も呈している。ならば、ビッグデータの本質とは何なのか。また、そこからメリットを得るには何が必要とされるのか――。この問いかけに応じた佐藤氏の話は、ビッグデータの利用価値や課題、さらには技術に至るまで多岐にわたった。
「大規模データ=ビッグデータ」にあらず
――現在、我々も含めて多くのIT系メディアが「ビッグデータ」をさかんに取り上げ、そのバズワード化が進みつつあるとも言えます。この状況をどう見ておられますか。
佐藤氏:ビッグデータの活用は企業競争力を大きく左右する重要なテーマです。また、久しぶりに「コスト削減」とは関係のないITが登場し、注目されている点については嬉しく感じてもいます。とはいえ、ビッグデータに対する周囲の見方や関心の急激な高まりには多少の戸惑いも覚えますね。
――それはなぜですか。
佐藤氏:1つは、ビッグデータの活用という特殊性も難度も高い取り組みが、あたかも、すべての企業の悩みを解決するものであるかのごとく扱われている点です。このような状況を見ると、ビッグデータそのものや、その分析に対する理解/認識が曖昧なまま、話題ばかりが先行しているような気がしてきます。
実際、企業の間ではビッグデータに対する誤解も散見されますし、ビッグデータの周辺技術についても、その特性や使い方が正しく理解されているとは言いがたい状況です。
実のところ、ビッグデータを解析して、企業を利する情報を引き出すのは簡単なことでありません。その実現に向けては、必要な道具立てをそろえるのはもとより、「データを読む力やセンス」を持った人材の育成/雇用など、相応の準備が必要とされるのです。
しかも、企業の中には、ビッグデータどころか、スモールデータ(小規模データ)すら十分に活用できていないところもあります。そのような状況にある会社が、ビッグデータを生かせるはずがないと私は見ています。
繰り返すようですが、ビッグデータの利活用で他に先んじることは競争優位を確立するうえで重要ですし、そのための準備に早い段階から取り組むことは正しいことです。ただし、その取り組みを行うに際しては、バズワードとしてのビッグデータに惑わされることなく、その本質や自社の現状に対する理解/認識を深めたうえでの冷静な対応が求められると言えるのではないでしょうか。
――では改めてビッグデータの定義をお聞きしたいのですが。ビッグデータとはそもそも何なのでしょうか。
佐藤氏:その手の質問をよく受けるのですが、ビッグデータに関してはこれといった定義があるわけではありません。
ただし、ビッグデータが意味するところは大きく3つあり、その1つはもちろん「大量のデータ」ですが、そのほかにも、「データの数(件数)の多さ」と「データの多様性(データ形式/種類の多様さ)」を指してビッグデータと呼ぶこともあります。
したがって、「大規模データ=ビッグデータ」と単純に見なすのは誤りであって、データ・サイズが1GB程度だとしても、そのレコード数が100万件になれば、それはビッグデータと言えるわけです。
また、「うちの社内にはビッグデータはない」と思っていても、社内のデータと社外の大量/多様なデータを組み合わせて何らかの分析を行おうとするならば、それはビッグデータの世界に足を踏み入れることになるのです。




























