ビッグデータ活用の肝はデータ・アーキテクチャの整備。最良のアーキテクチャをいかに作り上げるか?

現在、TwitterやFacebookといったソーシャル・メディアに投稿されるメッセージや、検索エンジンに対して日々ユーザーが入力する大量のキーワード、あるいはセンサーが収集する各種のログ・データなどといった「ビッグデータ」をビジネスで有効活用しようという動きが活発化している。ただし、そのためには、ビッグデータの利活用に最適なシステム・アーキテクチャを整備することが前提となる。東京ビッグサイトで開催された「ビッグデータEXPO 2012秋」において日本オラクル エンタープライズ・アーキテクト本部が行った講演の内容を基に、ビッグデータを活用するためのアーキテクチャ策定とそのプロセスを見ていこう。(編集部)

ビッグデータ活用のゴールは経営判断につながる情報を生み出すこと

日本オラクルエンタープライズソリューション統括本部 エンタープライズ・アーキテクト本部 担当ディレクターの田澤孝之氏
 ビッグデータと呼ばれる大量のデータを利用して、自社のビジネスに有益な知見を得ようとする動きが加速している。特に注目されているのが、ソーシャル・メディアに投稿されるメッセージや各種センサーから得られるログ・データなど、準構造化(非構造化)データと呼ばれる種類の情報である。これらを収集/分析することで、新たな価値の創造、あるいは目前のビジネス課題の解決につながるヒントが得られるのではないかと期待が寄せられているのだ。

 日本オラクルでエンタープライズ・アーキテクトを務める田澤孝之氏(エンタープライズソリューション統括本部 エンタープライズ・アーキテクト本部 担当ディレクター)は、このビッグデータの定義を次のように説明する。

 「日本オラクルでは、ビッグデータを『Volume(量)』と『Velocity(速さ)』、『Variety(種類)』そして『Value(価値)』という“4つのV”で定義している。まずVolumeだが、例えば過去の売上情報を、わずか半年分ではなく、1、2年という比較的、長期にわたる大量のデータを使って分析する。その情報を高速に分析するのがVelocityで、データを高速に分析できれば、ビジネス上のメリットもいち早く得られる。次のVarietyは情報の種類であり、これまで企業内に蓄積されてきたトランザクション・データだけでなく、ソーシャル・メディアやブログなどの情報も取り込んでいく。ただし、情報の量や種類を増やしても、そこから価値を得られなければ意味がない。つまり、最後にValueを得ることが目的となる」


 そして田澤氏は、経営判断につながる情報を生み出すことがビッグデータのゴールだと説明する。

 「現在、企業で使われているシステムは、1バイト当たりの処理単価が高いトランザクション・データを扱う前提で設計されている。一方、ソーシャル・メディアの情報やWebサーバのログ、あるいは各種センサーから得られる情報は、膨大なボリュームがある一方で、これまではあまり価値を見い出されていなかった。つまり、バイト単価が安いデータだと言える。オラクルでは、この2種類の情報をミックスさせることにより、企業が抱えるビジネス課題にアプローチし、新たな手法でビジネス上の意志決定を行えるようにすることがビッグデータのゴールだと考えている」(田澤氏)

重要なのは複数種のデータの相乗効果を引き出すこと

 このビッグデータの活用をスムーズに進めるうえでは、「まずゴールを明確化し、仮説を立てて検証を行うというエンタープライズ・アーキテクチャのアプローチを採用するのが正しい」と田澤氏は説く。

 エンタープライズ・アーキテクチャとは、業務やシステムの全体最適を図るための考え方であり、オラクルでは「オラクル・エンタープライズ・アーキテクチャ・フレームワーク」として、「ビジネス・アーキテクチャ」、「アプリケーション・アーキテクチャ」、「インフォメーション・アーキテクチャ」、「テクノロジー・アーキテクチャ」という4つのドメインを定義している。


 この中でビッグデータが位置するのは、インフォメーション・アーキテクチャの領域である。従来のインフォメーション・アーキテクチャでは、トランザクション・データ(主に企業内のビジネス・プロセスで発生し、RDBなどに格納されるデータ)を基にビジネス上の意志決定を下すことが想定されていた。

 しかし今後は、ソーシャル・メディアに投稿されるメッセージやWebサイトなどのアクセス・ログ、画像や動画、各種マシンが生成するデータなど、企業はさまざまな情報を基に意志決定するようになる。それを実現するためには、データの『取得』と『体系化』、『分析』、そして『意志決定』という4つのステップが必須であり、これをサイクリックに反復しつつ仮説立案と検証を繰り返し、そのうえで「複数のデータ領域の相乗効果を十分に引き出すことが重要だ」と田澤氏は強調して説明を締めくくった。

ビッグデータ解析の4つのプロセス

 田澤氏に続いては、同じくエンタープライズ・アーキテクト本部でシニアITアーキテクトを務める中山耕一郎氏が登壇し、ビッグデータの活用で必要となるシステム・アーキテクチャを先の4つのステップに沿って説明した。

日本オラクル エンタープライズソリューション統括本部 エンタープライズ・アーキテクト本部 シニアITアーキテクトの中山耕一郎氏
 まず「取得」はビッグデータをシステムに蓄えるステップであり、処理形態によって利用すべき技術が異なる。一度に大量のデータをバッチ的に取り込む場合はHDFS(Hadoop Distributed File System)が適しており、一方で大量のデータを低レイテンシに書き込む場合はNoSQLデータベースのような分散KVS(Key Value Store)が適する。また、「データを単純に取得して蓄えるだけでなく、必要なデータだけをフィルタリングして構造化データとして活用したり、リアルタイムに活用したりといったアプローチもある。そのような場合にはCEP(Complex Event Processing)のような技術も必要だろう」と中山氏は話す。

 次の「体系化」では、取得したデータを価値あるものに変えていくことが目的となる。従来の構造化データであれば、データをETL(Extract/Transform/Load)処理で体系化し、データ・ウェアハウスなどで分析するといった流れになるだろう。それに対して、非構造化データを含むビッグデータでは、Hadoop(MapReduce)を活用してデータを体系化することになる。また、MapReduceで処理されたデータと従来の構造化データをひも付けて体系化し、活用する場合もあるだろう。中山氏は、このステップのポイントとして「仮説を立てながら検証を繰り返し、さらに非構造化データを構造化データと組み合わせて活用することだ」と説明する。

 続く「分析」、そして「決定」のステップは、従来から企業システムに存在する分析プラットフォームが担う領域だが、ビッグデータの本格的な活用のためにプラットフォームを見直し、最適化する動きがあるのも事実だ。「非構造化データに対する分析」、「大量データに対する高速な分析」、「従来の構造化データに対する分析の高度化」などが新たな課題となる。

 このステップでポイントとなるのは、分析したデータをどのように活用するかということだ。従来と同様に分析ユーザーを介して“打ち手”を検討/実施するのはもちろん、「フロント・アプリケーションのダッシュボードにデータを反映する」、あるいは「リアルタイムにアラートを通知する」、「イベントをトリガにしてワークフローを進める」、「新たなルールやロジックにフィードバックする」といったことも考えられる。

オラクルが考えるビッグデータ活用のためのリファレンス・アーキテクチャ

 以上に説明したステップを実践するためのシステム・アーキテクチャで必要な機能要素をまとめたものが、次のリファレンス・アーキテクチャである。

 これらの機能要素は必ずしもすべてが必要というわけではなく、適材適所で適用すればよい。リファレンス・アーキテクチャとは、文字どおり自社のシステムの将来像を検討するための参考図面なのだ。

 また中山氏は、このリファレンス・アーキテクチャを支える重要なプラットフォーム技術として「ビッグデータ・クラスタ」と「高スピード・ネットワーク」、「RDBMSクラスタ」、そして「インメモリ分析」を挙げた。これらの技術を実装したプラットフォームが、Oracle Big Data Appliance、Oracle Exadata、Oracle ExalyticsなどのEngineered Systemsである。

 エンタープライズ・アーキテクト本部では現在、以上のようなアーキテクチャを参考図面として、ビッグデータ活用に取り組む企業に対する支援を行っている。

 最後に中山氏は、ビッグデータ活用のアプローチを下支えするものがエンタープライズ・アーキテクチャにほかならないことを次のように説いて講演を締めくくった。

 「ビッグデータを活用していくためには、一定の先行投資が必要となる。もちろん、その先行投資に対しては、効果の明確化が求められるだろう。しかし、いきなり目を見張るような効果を得るのは容易ではない。まずは社内的な利用から始め、トライアルを繰り返す中で効果検証を行い、そのうえで社外のサービスに展開していくというアプローチをとるのが現実的だろう。このようにビックデータの活用をステップアップしていくうえで、エンタープライズ・アーキテクチャをベースにしたアプローチは非常に有効だ」

 構造化データから非構造化データまで、多様なデータの活用を目論むビッグデータへの取り組みは、企業にとっては情報活用の総力戦となる。その成否を大きく左右するのが、インフォメーション・アーキテクチャをはじめとするエンタープライズ・アーキテクチャの各アーキテクチャがどれだけ整備されているということだ。日本オラクルは、エンタープライズ・アーキテクチャに関するスペシャリスト集団として、田澤氏や中山氏らが所属するエンタープライズ・アーキテクト本部を組織し、企業の現状システムの整理から将来システムの構想までを支援している。

 エンタープライズ・アーキテクト本部の強みは、個別の製品やソリューションに依存しないエンタープライズ・アーキテクチャを策定する一方で、オラクル製品をはじめ現場で実績のある製品/ソリューションによる“動くシステム・アーキテクチャ”の策定までを包括的に支援できるところだ。「ビッグデータの活用に興味はあるが、どのように始めたらよいのかわからない」といった企業がまず相談する相手としては、うってつけの組織でもある。ビッグデータの活用をはじめ、そのベースとなるシステム連携やシステム統合で課題を抱える企業は、一度彼らに相談してみてほしい。最新の技術/手法に基づくアドバイスが聞けるはずだ。

Comments:

Post a Comment:
Comments are closed for this entry.
About

Twitter
Facebook

Search

Recent Posts
Archives
« 4月 2014
  
1
2
3
4
5
6
7
9
10
11
12
13
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
   
       
Today