X

Big Data、Data Integration、Data Lakeに関するテクノロジー、製品・サービス情報、セミナー情報などをお届けします

クラウドでリアルタイムデータをキャプチャして分析

Nobuaki Tanigawa
Senior Business Development Manager

※本投稿は、Capture and Analyze Real-Time Data in the Cloud を元に翻訳した投稿です。

ビジネスイベントが発生したときにそれを理解して対応することは、これまで以上に重要です。 顧客行動、詐欺行為、およびマーケティング機会の変化は、数時間、数日、数週間後ではなく、発生した瞬間に対処する必要があります。 多くの企業がこの必要性を認識し、企業内の異なるグループによる消費のためにリアルタイムのビジネスイベントを提供するためのストリーミングバックボーンを開発しました。

主に2つの課題があります。どのようにしてビジネスアプリケーションからストリーミングデータを取得するかと、その結果得られるストリーミングデータをビジネス上の洞察と決定にどのように変換するかです。多くの組織ではストリーミングイベントを作成するためにトランザクションデータベースからのレプリケーションと変更データキャプチャを使用しています。このアプローチは、ストリームパブリッシングコードを使用してアプリケーションを直接手動で組み込むよりも明らかな利点があります。非侵襲的で労力がかからず、アプリケーションオーナーにとってリスクが低く、すべての障害シナリオでデータベースとストリームのデータが一致する信頼性があります。Oracle GoldenGateはトランザクションレプリケーションのマーケットリーダーであり、さまざまなデータベースベンダーからのデータを他のデータベース、またはApache Kafkaなどのビッグデータおよびストリーミング環境にレプリケートするための広範な接続オプションを提供します。Oracle Data Integration Platform Cloud(DIPC)は、この機能をOracle Cloud Infrastructureのサービスとして提供します。ストリーミングデータの処理と分析、および自動化された意思決定の推進のために、オラクルはOracle Stream Analytics(OSA)に豊富な対話型ユーザー・インタフェースとApache Sparkに基づくスケーラブルなランタイムを提供します。

Oracle OpenWorld 2018では、ハンズオンラボ「Oracle Data Integration Platformクラウドを使用したOracle GoldenGateストリームの分析」の一環として、リアルタイムデータの取得と分析を行うエンドツーエンドのユースケースを紹介しました。 ユースケースは、顧客の動向や購買履歴に基づいてリアルタイムのマーケティング機会に対応することです。 ラボでは、プログラミングや低レベルの設定を行わずに、これを簡単なユーザーインターフェイスで設定する方法を示します。 ラボでは、Spark用のOracle Big Data Cloud環境とKafkaストリーミング用のOracle Event Hubも使用しています。

最初のステップは、DIPCコンソールを開いてレプリケーションランタイムを管理するDIPCエージェントを起動することです。 エージェントはクラウドまたはオンプレミスにデプロイできるため、任意の場所でレプリケーションを実行できます。

次のステップで、ユーザーはソースデータベースとターゲットKafka環境との接続を設定できます。 DIPCは、ソースデータベースからメタデータとプロファイリング情報を自動的に収集して、ユーザーに詳細なスキーマ情報を提供します。

ユーザーはグラフィカルデザイナーを使用してレプリケーションを設計し、どのスキーマとテーブルがプロセスに参加するべきかの詳細を選択し、Kafkaにイベントを提供することができます。

レプリケーションの進行状況は、タスク監視ページで監視および制御できます。 ユーザーは、イベント数、エラー、データの遅れ、およびその他の重要な要因に関する統計を確認できます。

データがKafkaに複製されると、ユーザーはStream Analyticsユーザーインターフェースにアクセスしてイベントの分析を開始できます。 ユーザーは、データベースの変更内容を含むKafkaトピックに基づいてパイプラインを作成します。 パイプラインは着信イベントからのデータを表示し、ユーザーがデータストリームを対話的に処理し分析することを可能にします。

ユーザーは、イベントを段階的に強化および変換する処理ステップを追加し続けます。 2番目のステップは、データベースからの追加の顧客データでイベントデータを充実させることです。

3番目のステップでは、ジオフェンスに基づいてイベントをフィルタリングするためのパターンを追加します。 ジオフェンスは事前定義済みの領域です。この場合、顧客へのオファーをトリガーする小売場所です。 ユーザーは、ユーザーインターフェイスでジオフェンスに関連して個々の顧客の場所を確認できます。

フィルタリングの後、ユーザーは製品のスコアリングステップを通じて機械学習モデルを適用するなど、さらに処理を追加することができます。 最後に、オファーを受け取る必要がある顧客との処理済みイベントをターゲット・ストリームに格納して、顧客との通信を開始することができます。

要約すると、ハンズオンラボでは、データベースの変更から複雑なリアルタイム分析ソリューションに移行して、ビジネスがリスクと機会に即座に対応できるようになることを60分以内で実現できることがわかりました。

詳細は、Oracle Stream AnalyticsOracle Data Integration Platform Cloud、およびOracle GoldenGateを参照してください。

Be the first to comment

Comments ( 0 )
Please enter your name.Please provide a valid email address.Please enter a comment.CAPTCHA challenge response provided was incorrect. Please try again.