NTT DATA Global IT Innovator
NTTデータ経営研究所
English  お問い合わせ  サイトマップ
戻る サイト内検索
戻る

『情報未来』

当社の研究、コンサルティング、事例から厳選された、お客様の問題解決に役立つ情報誌。

No.40 (2013年10月号)

特集レポート

ビッグデータ時代におけるビジネス・アナリティクス

中川 慶一郎
中川 慶一郎
株式会社NTTデータ数理システム 取締役 博士(工学):マーケティング・エンジニアリング、 オペレーションズ・リサーチ、応用統計

なかがわ けいいちろう
日本OR学会、日本経営工学会などマーケティング・エンジニアリングを中心とした学術研究からビジネス分野のデータ分析、データマイニングについてコンサルティングまで幅広く活動。
H11年度より日本OR学会マーケティング・データ解析研究部会などBI、マーケティング・エンジニアリング、データマイニングに関連する5学会研究部会と連携してデータ解析コンペティションを主催
著作:「BI革命」(共著)、「マーケティングの数理モデル」(共著)、「公共経営と情報通信技術」(共著)、「マーケティング・データ解析」(共著)

 情報技術が猛烈な勢いで進化する中、そこで発生するビッグデータといかに向き合うかということが企業経営者の大きな関心事となっている。

 NTTデータ・グループでは、ソーシャル、エンタープライズ、M2Mの3つを軸にビッグデータ・ビジネスを展開しており、データ基盤、ビジネス・アナリティクス基盤、分析方法論における3つの強みと豊富な実践経験、多数の専門家集団によってお客様のビックデータ活用を支える体制を整えている(図表1)。また、NTTデータ数理システムはビジネス・アナリティクス基盤となる独自の分析ツール群をもとに受託開発やコンサルティング・サービスを提供している。

図表1:ビッグデータをフル活用する
「データウェアハウス/ビジネスインテリジェンス・ラボ®」サービス

ビッグデータをフル活用する「データウェアハウス/ビジネスインテリジェンス・ラボ(R)」サービス

(出所:NTTデータにて作成)

 2012年NTTデータ・グループ入りしたNTTデータ数理システムは、創業以来30年間、社会のあらゆる分野で起こる問題を数理科学とコンピュータ・サイエンスによって解決する専門家集団として活動してきた。ここでは、NTTデータ数理システムのビジネス領域であるビジネス・アナリティクスから見たビッグデータの方向性を考えてみる。

ビジネス・アナリティクスの新たな挑戦

 一般に、ビッグデータはVolume(量)に加えて、Variety(種類)、Velocity(頻度)という特徴があり、このようなデータが爆発的に増えた結果、従来のRDBではデータが貯めきれない、あるいはデータの発生に処理が追いつかないといった現象が起こっている。

 ビッグデータの論議は当初、並列処理により大量データを蓄積・処理するHadoopや時系列的に発生するストリーム・データを処理するCEP(Complex Event Processing:複合イベント処理)のように、データをどう蓄積、検索、処理するかというデータ基盤の話に終始してきた。ところが、ビッグデータを使って何をするのかということに焦点があたるにつれて、データ分析によってビジネスに資する洞察を引き出す「ビジネス・アナリティクス」や、それを実践するいわゆる「データ・サイエンティスト」と呼ばれる人材の確保に関心が移っている。

 とはいえ、全般的に見るとビッグデータは技術の問題として捉えられる傾向が強く、ビジネス・アナリティクスに対する認識も統計解析やデータマイニングを含む従来のビジネス・インテリジェンスと明確な差はない。しかし、我々はビッグデータは新しいものの見方、捉え方、考え方を与えるパラダイム・シフトであり、それに合わせてビジネス・アナリティクスも、これまでのビジネス・インテリジェンスでは成しえなかった新たなチャレンジの時期を迎えていると考えている。以降では、ビッグデータがもたらすパラダイム・シフトとそこでのビジネス・アナリティクスについて説明する。

これまで目をつぶってきた事実に目を向ける

 ビッグデータにより顕在化した1つ目のパラダイム・シフトは、これまで把握するのは困難だとして目をつぶっていた、あるいは諦めていた事実に積極的に目を向けていこうとする “ものの見方” の変化である。

 ここで、従来のビジネス・インテリジェンスとビッグデータ時代におけるビジネス・アナリティクスは何が違うのか、ということを考えてみよう。結論から言うとビジネス・インテリジェンスは、 “食べやすいデータしか食べてこなかった” のである。これは、鍵をなくした酔っ払いが、なくした場所ではなく、明るい場所で鍵を探すという例え話と同じである。

 例えば、POSデータのようにリレーショナル・データベースに格納しやすい構造化されたデータを多次元分析(OLAP)ツールで「見える化」するのが、従来型のビジネス・インテリジェンスである。しかし、POSデータはあくまで売れた結果であり、事実の一部分でしかない。したがって、他に欲しい商品がなかったので仕方なく買ったのではないかといった、その背後にある ”なぜ “を考える手掛かりが欠落している。

 これまでビジネス・インテリジェンスに関わる多くの人々は、この当たり前の事実を認識していながら、把握するのは困難だとして、目をつぶってきたのである。これに対して、AmazonのようなECサイトでは、商品検索の履歴、レコメンドに対する反応などのデータを蓄積し、これを分析することで顧客が購買するまでのコンテキストを把握している。その一方で、最近ではリアルな店舗でも、店舗内の映像データから顧客の行動を認識し、店舗内をどのように巡り、どのような商品を手に取って、最終的にどの商品を選択したかというコンテキストを把握しようとする試みがなされている。

 このような分析を行うためには、画像の解析による顧客の識別、顧客動線の抽出、手に取った商品特定など、非構造化データを扱う必要がある。一般に非構造化データとは、何も構造化されていない文章や音声、画像など、そのままではリレーショナル・データベースでは扱うことができないデータを指す。通常、非構造化データは人間が目で見て判断するのは容易でも、コンピュータに扱わせるとなると実に扱いづらいデータである。得てして扱いづらいデータの中に表面的な事実では分からない情報や経営判断をする上で無視できない情報が含まれているものである。

 「見える化」は情報分析・活用の第一歩であり、その重要性は何ら変わることはない。現在行われているビジネス・アナリティクスのチャレンジは ”食べづらいデータを食べてみて“、そこから一歩進んだ「見える化」を実現し、意味のある洞察を導き出そうというものである。

“どうにもならない時間間隔” を埋める

 ビッグデータがもたらす2つ目のパラダイム・シフトは、状況を理解する際に生じる “どうにもならない時間間隔” の捉え方に関する変化である。

 例えば、電車の事故が発生したときを考えてみる。駅で足止めされた人達の多くは、事故の状況を知りたいと考えるが、実際に状況が分かるのは、ある程度時間が経ってからであろう。このような状況に直面すると、最近では多くの人がTwitter上のつぶやきから状況を推測して、迂回の判断などをしているのではないか。このようにTwitterはインシデント発生直後の数十分間を埋めるのに威力を発揮するメディアである。

 ビジネスの世界に限らず、世の中には ”どうにもならない時間間隔“があり、結果として何も手を打てないという状況がある。例えば、食品・日用雑貨品のように売り場での棚の獲得競争が激しい業界では、新商品を発売してから実際に商品の売上がどのように推移しているのか、また、消費者に受け入れられているのかということをいち早く知る必要がある。かつては発売後一定時間を経過してから、リサーチを行えばよかったが、今では発売後1週間の売上で商品の成否を判断されてしまう。しかし、それに合わせてリサーチを行ったとしても、この時間間隔を埋めることは困難であった。

 他にも、総務省の消費者物価指数(CPI)や日銀短観の業況判断指数(DI)など、経済の体温を表す指数は投資意思決定や景気判断を行う上で決定的な意味を持つが、集計の都合上、それを知るには数か月間の”どうにもならない時間間隔“が存在する。

 この時間間隔は、単純にリアルタイム性というよりは、ビジネスの文脈によって決まるタイム・ラグの問題であり、30分の場合もあれば、3時間、場合によっては数週間から数か月、極端な例を挙げると国勢調査のように2~3年ということもある。

 このような状況では、正確さは多少犠牲にしてでも状況を把握し、何とか手を打ちたい、そのために使える情報は何でも使いたいという気持ちに駆られるであろう(図表2)。ビッグデータにおけるビジネス・アナリティクスの新たなチャレンジはこの時間間隔を埋めることである。

図表2:正確さは犠牲にしても状況を把握したい場面

正確さは犠牲にしても状況を把握したい場面

(出所:NTTデータにて作成)

 先ほど挙げた新商品の例では、Twitterのユーザを話題の関心領域や情報受発信の感度で、いくつかのセグメントに分けて、各セグメントにおける商品のトライアル・リピート状況や評判をいち早く分析し、発売直後のアクションに結び付ていこうとする試みがなされている。

 他の例としては、Googleが開発した「インフルトレンド」という指標が挙げられる。日本でもインフルエンザが流行すると、タミフルの備蓄と配布が話題になるが、インフルエンザを発症した患者数を集計してから予防策を実施しても手遅れであり、ここにも “どうにもならない時間間隔” が存在していた。「インフルトレンド」は、特定の検索キーワードとインフルエンザ流行との関係を分析した結果、導き出された指標であり、インフルエンザ流行の状況を地域ごとに推測することで、この時間間隔を見事埋めている。

 経営にとってスピードは命であり、多少精度を犠牲にしてもこの “どうにもならない時間間隔” を克服できるのであれば他社に対する強力な武器となる。ここで求められるビジネス・アナリティクスは、予測というよりはむしろ、ごみを含むデータ、あるいは直接的には関係のないデータであったとしても積極的に取り込んでいくことで、関連する情報から今そこにある現実をいち早くあぶり出すことである。

複雑な状況でも合理的に判断する

 3つ目のパラダイム・シフトは、複雑な状況の中で少しでも合理的な判断を行うためにビッグデータを活用していこうという考え方の変化である。

 身近な例を考えてみよう。家電製品を買いたいと思ったとき、多くの消費者は価格.comで値段・性能を比較したり、Amazonで他の人は何を買っているのか、あるいは実際に買った人の評価はどうかを調べたりするなど、ネットで得られる情報を最大限に活用して判断するのではないか。ここで注意すべきは、どの商品をどこで買うべきかという消費者の ”課題解決のプロセス“は格段に進化しており、以前とは比べものにならないほど合理的になっているということである。

 もう少し複雑な状況として、取引企業の審査をする場合を考えてみる。そこでは単純な財務内容だけでなく、資本関係や他社との取引先関係、コンプライアンスや風評など網羅的な判断が求められる。ここでのビジネス・アナリティクスは、財務内容の急激な変化や同業他社との差異を比較するといった定型化しやすい分析だけでなく、散在するビッグデータをもとに資本関係や他社との取引先関係の可視化をしたり、ネット上の評判を集約したりするなど、アドホックな分析も組み合わせていくことが求められる。

 1997年にIBMが開発したDeep Blueがチェスの世界王者ガルリ・カスパロフを破ったというニュースが世界を駆け廻り、最近ではコンピュータ将棋がプロの棋士を破ったという記事が新聞を賑わせた。しかし、Deep Blueの勝利から15年の間に静かな変化が起こっていることはそれほど知られていない。

 現在世界最強のチェス・プレーヤは、スーパー・コンピュータでもチェスのチャンピオンでもなく、ごく普通のPCを使ったアマチュアのチームである。2005年に行われたフリースタイルのチェスで、PC3台を駆使した2人のアマチュアが、臨機応変に様々な手を探索することでスーパー・コンピュータと組んだチェスのチャンピオンを破り、チャンピオンになったのである。

 これは複雑な状況を前にして合理的な判断を下すために、ビジネス・アナリティクスは何をすべきか、ということについて興味深い示唆を与えている。今後ビジネス・アナリティクスが立ち向かうべきチャレンジは、かつてJ.C.R.Lickliderが提唱した「コンピュータによる知能増幅 (Intelligence Amplification)」というコンセプトのように、分析によっていかに人間の意思決定能力を強化できるかということである。特に、現状の「見える化だけではなく、このまま行くとどうなるか、あるいは、ここで行動を起こすと結果はどう変わるのかといった将来の「見える化」を実現することがポイントとなる。

 危機管理に見られるように、人間はこれまでも複雑で不確実な状況の中で、分からないなりに判断を下してきた。より合理的な判断を実現するためには、コンピュータはビッグデータの分析によって状況判断や意思決定に必要な材料を準備し、人間は俯瞰的、総合的な判断を担うという役割分担にもとづき、課題解決のプロセスを再構築していくことが必要となるであろう。

おわりに

 ここまでビッグデータがもたらす3つのパラダイム・シフトとビジネス・アナリティクスの新たなチャレンジについて概観してきた。これらのパラダイム・シフトを通じて、今ビジネス・アナリティクスに求められているのは、分析というレンズを通して、これまで見えづらかったものを如何に見えるようにするかということである。

 最後に、ビジネス・インテリジェンスであれ、ビジネス・アナリティクスであれ、企業の内外に存在するデータを分析して、経営意思決定に役立てるという根本的な発想は時代を超えて不変である。また、一番肝心なことは分析の目的であり、ビッグデータを分析する上でも目的のない分析は海図なき航海と同じであることを付け加えたい。

〈参考文献〉
J.C.R. Licklider: "Man-Computer Symbiosis," IRE Transactions on Human Factors in Electronics, March 1960.
インフルトレンド: "http://www.google.org/flutrends/".
(注)本稿に掲載した会社名、製品名またはサービス名は、それぞれ各社の商標または登録商標です