トピックスTOPICS
歳末商戦のにぎやかな掛け声が街にあふれる12月のお昼時。あなたはいつものコンビニの店頭で、最近お気に入りの 「焼きパスタ ラザーニャ」 を買い、代金と一緒にポイントカードを差し出した。店員は慣れた手つきでポイントを入力して返してくれた。
週末。あなたは私鉄を利用して、東京郊外に住む知人を訪ねた。料金の支払いはIC乗車券 「パスモ」 で改札機にペタンとタッチ。「パスモ」 があれば、JRにも地下鉄にも他の私鉄にも乗れるから重宝している。目的の駅を降りたら私鉄系のストアで手土産を購入。レジでは私鉄グループのポイントカードを差し出した。
2013年の年末。あなたの行動は、去年の年末とほぼ同じかもしれない。しかし、店や施設の側では、去年とは違った 「何か」 が進行している。企業のビジネススタイルや顧客サービスを変え、人々の価値観さえ変えようとしているもの。それが 「ビッグデータ」 だ。
今年2013年の5月、『ビッグデータの正体』(講談社)という本が出版された。「情報の産業革命が世界を変える」 と銘打って欧米の最新事例を紹介したこの本では、ビッグデータを象徴するエピソードとして、グーグルが国に先駆けて新型インフルエンザの流行を予測した例が紹介されている。
2009年春、新型インフルエンザが世界的大流行(パンデミック)の兆しを見せ、日本でも大きな騒動となった。アメリカでは疾病管理予防センター(CDC )が全米の医療機関に症例の報告を求めた。だが、症例と診断され、情報が集約・整理されてセンターに届くまでに1~2週間はかかる。感染拡大を抑えるうえでこのタイムラグは致命的だ。ところがこの時、グーグルは感染が広がっている地域を、ほぼリアルタイムで正しく特定していた。
使われたのはインターネット上の検索だ。グーグルでは全世界で1日に30億件以上の検索が行われる。感染が広がり、自覚症状のある人が増えれば、「咳の薬」 「解熱剤」 「かぜ薬」 といったワードの検索が増える。アルゴリズム解析によって、どの地域でワードの出現頻度が高いかといった感染流行の相関関係が見つかれば、「今、全米のこの辺りで感染が拡大している」 と特定し、いち早く有効な措置がとれる。
私たちは長らく、「現象を発見 → 標本を抽出(サンプリング)して検証 → 原因と結果を特定 → 結論」 に至るという 「因果関係による推測」 の世界観に馴染んできた。しかし、グーグルの事例は、推測には因果関係よりも相関関係が重要であると立証した。もしも膨大なデータの海をそのまま解析できる技術があれば、現象がいきなり結論を析出する全く新しい世界観が成り立つ。「結果がわかれば理由はいらない。因果関係は不要、相関関係を注視すればいい」 ―― これが、ビッグデータ的発想が 「データが語る」 と表現する世界観である。
ビッグデータが扱うのは検索ワードに限らない。公機関が持つ住所氏名生年月日などの個人情報や、病院の電子カルテ、小売店舗のPOSデータなどもそうだ。この他、各種施設の防犯設備のセンサーやマイカー車載の各センサーがデータセンターに送る情報、SuicaやパスモなどのICカードで集まる行動記録、スマートフォンやフィーチャーフォンで集まる位置情報やアプリ利用履歴(静的な個人情報と区別してこれらの動的な記録はパーソナルデータと呼ばれる)まで、あらゆるものがデータになる。ツイッターやフェイスブックなどのSNSには、テキスト、画像、音声の形で膨大な感情記録が蓄積されている。
そういった、数値化して一定のフォーマット上(データベース)で扱うことができない 「非構造化情報」 は、実は人間の活動に伴って生成される情報全体の8割を占めるとされている。これらを様々なビジネスやサービスに生かせるように 「データ化」 し、分析し、目的に応じて利用できるようにするアルゴリズムやツールが、ここ数年、徐々に出現している。この下地の上に、大手ソリューション会社やマーケティング会社、広告代理店などが企業のビッグデータ分析に手を貸そうと乗り出しているというのが、2013年末現在の日本の状況だ。