鈴木: なので、ビッグデータというのはデータのサイズではなく、収集するデータが持つ大まかな特性に注目したほうが良いと思います。
池田: 米国の調査会社ガートナーが定義した3V(データ量の多さを示すVolume、種類の多さを示すVariety、リアルタイム性を示すVelocity)などが有名ですね。
鈴木: そうですね。私はビッグデータの特性を「高解像」「高頻度生成(リアルタイム性)」「非構造かつ多様」と定義しています。
池田: 「高解像」? カメラとかの話ですか?
鈴木: 精細な画像というイメージで合っています。これはデータの“細かさ”ですね。マーケティングを例に取ると、例えば調査会社が「30代男性はこんな趣味で、こういう特性がある」という調査結果を出したとしましょう。これは規模感が大きな、マクロな話ですよね。こういう情報を「解像度が低い」データと呼んでいます。
一方で「解像度が高い」データとは、30代男性をひとくくりにせず、Aさんはこうで、Bさんはこうで――と細かい単位で分析したものですね。これならば、個々人の趣味思考に合わせたプロモーションができる。ビジネスにより役立ちますが、1人1人のデータを作るので、データのサイズが大きくなるわけです。リアルタイム性もそうですね。1年ごとのデータを取るよりも、もう少し頻度を高めてデータを収集し、活用した方が有用なシーンは多いですが、ひんぱんにデータを収集するのでデータサイズは大きくなる。
池田: なるほど。ちなみにこういった定義も含め、ビッグデータという言葉はいつごろから出てきたのでしょうか。
鈴木: 誰が最初に言い始めたか、というのは諸説あって、はっきりとは分からないのです。ビッグデータという単語自体は専門的なものではないですからね。単に「大きなデータ」(Big Data)と言ったのか、今でいうビッグデータを指しているのかは分かりません。
私が調べた中で最も古かったのは、1998年に米国のコンピュータ会社、シリコングラフィックスのチーフサイエンティストだったジョン・マシェイ氏が“Big Data and the Next Wave of Infra Stress”という発表をしていたことですね。
池田: なんか想像していたよりもずっと古かったです。
鈴木: 最近の盛り上がりについて言えば、2010年に英国の経済誌『エコノミスト』が“Data, data everywhere”(参照リンク)という特集を組んだことが大きなきっかけになったと考えられます。それより2年前の2008年にも、科学誌の『ネイチャー』で“Big Data”の特集が組まれていますね。
池田: 日本国内ではどうでしょうか。
鈴木: 日本テラデータなど、外資系のITベンダーが2011年の年頭所感で「Big Data元年」と言ったのが始まりでしょう(参照リンク)。2011年の秋に経済新聞などでも複数回にわたって取り上げられたことで、ビジネスパーソンやユーザー企業(ITベンダー以外という意味)に波及していったものと思われます。
池田: ビッグデータという言葉が生まれてから、盛り上がるまでにずいぶん時間がかかっていますね。なぜ、今になってビッグデータが注目されているのでしょうか?
(次回へ続く)
「ビッグデータ? とりあえず大量に集めたデータを生かす、って感じだよな?」
高速道路の渋滞緩和も、コンビニの人気商品開発も、クレジットカードの不正利用検知も……IT用語の枠を超え、いまや一般的なビジネスキーワードとなった「ビッグデータ」。よく耳にする言葉ですが、改めてどんな意味かと問われると答えに困る人も多いのでは。そんなビジネスパーソンに向けた特集が始まりました。
本特集では、ビッグデータの基礎知識からスタートし、ビジネスや生活シーンでどのように活用されているのか、具体的かつ面白い事例を紹介していきます。こちらもぜひ、ご覧になってください。
Copyright © ITmedia, Inc. All Rights Reserved.
Special
PR注目記事ランキング