X

Big Data、Data Integration、Data Lakeに関するテクノロジー、製品・サービス情報、セミナー情報などをお届けします

Oracle Data Minerを使って機械学習をはじめよう

Oracle Data MinerはOracle Databaseに内包されたIn-Database Analyticsのためのエンジンで、GUI操作でデータの分析・機械学習を行うことができます。
今日は、Oracle Data Minerの一連の操作を実行できる、ハンズオン資料をご紹介します。

 

Oracle Data Minerが利用できる環境

Oracle Data Minerは、Oracle Cloud環境のPaaSデータベース(DBaaSインスタンス)では、High PerformanceまたはExtreme Performanceに含まれています。

オンプレミス環境のデータベースではEnterprise EditionのAdvanced Analytics Optionに含まれています。

Oracle Data Minerをはじめよう

データベースの準備

ここでは、Oracle Cloud環境のPaaSデータベース(DBaaSインスタンス)を例として挙げています。

サンプルスキーマのインストール

データベースを準備し、サンプル・スキーマをインストールします。サンプル・スキーマのインストール方法が不明な場合は、こちらもご参照ください。

Data Minerを実行するユーザを作成

create user <username> ...; で、Data Miner用のDBユーザを作成します。

SQL Developerのダウンロードと接続

OTNからOracle SQL Developerをダウンロードします。

以下の資料に従い、先程作成したDBユーザで接続します。

Oracle Data Miner ハンズオン 準備:SQL Developerから接続

Oracle Data Minerで機械学習

顧客の様々な属性情報から保険商品を購入してくれそうかどうかを予測するモデルを、機械学習によって作成します。以下の資料に従って実施します。

Oracle Data Miner ハンズオン 「分類モデルによる予測」

ハンズオン概要

  • 顧客情報データ(年齢、職業、車を持っているかどうか等の様々な属性情報を持つ、かつ、保険を購入したかどうかのフラグ列を持つ)が、データベース上のテーブルに格納されている
  • 上記テーブルのデータに対して、教師あり学習(分類モデルによるモデル構築)を行う
  • 分類モデルでは、決定木、GLM、SVM、ナイーブ・ベイズアルゴリズムを使用する
  • 完成したモデルを、新規データに対して適用する
  • これらの操作が全てGUI操作にて実施

ハンズオンでは、接続したユーザがもつ実テーブルに対して機械学習を行いました。対象データはそのユーザから参照できればOKなので、他のユーザが持つテーブルのデータも、SELECT権限があればもちろん利用できます。

更に言えば、Oracle Databaseには、外部表(External Table)という便利な機能があります。参照できればOK(大事なことなので2回言いました?!)ということは、「外部表を利用してOS上のファイル」や、今まで本BLOGでもご紹介してきた「外部表+Big Data SQL によってHadoop上のデータ」に対しても、Oracle Data Minerを使って機械学習を実行することができます。

Oracle Cloudでは、無料ではじめられるトライアル環境がありますので、ぜひご利用ください。

※本資料の動作確認は、Oracle Database 18.2 (18.0.0) High Performance と、SQL Developer 18.3 で行いました。

追記:

ハンズオン資料の第2弾を公開しています。続けて、ぜひお試しいただけると嬉しいです。

Oracle Data Minerハンズオン:GLMでの分析

 

Be the first to comment

Comments ( 0 )
Please enter your name.Please provide a valid email address.Please enter a comment.CAPTCHA challenge response provided was incorrect. Please try again.Captcha