※ 本記事は、George Lumpkinによる”Latest Autonomous Data Warehouse innovations breaking through data management boundaries“を翻訳したものです。
2023年5月15日
データは、組織の最も貴重な資産となる可能性を秘めています。しかし、どうすればその可能性に到達できるのでしょうか? どうすれば、データを共通通貨のように使いやすく、交換しやすくできるのでしょうか? そして、どうすれば銀行を破綻させることなく、それを実現できるのでしょうか。
データを簡単に使えて、信頼性が高く、経済的で、安全性を確保することが、Autonomous Databaseのサービス開始以来の目標であり、確実にその道のりをすすんでいます。そのため、私たちは常にイノベーションに努めており、昨年だけでも100を超える新機能をリリースしました。Autonomous Databaseは自動的にアップグレードされ、システムの実行中もユーザー・エクスペリエンスが向上するという事実に大変誇りを持っています。Autonomous Databaseは、99.995%のアップタイムの約束を果たしています。
「お客様は、多くの障害に直面しています。例えばオンプレミス、クラウド、SaaSのアプリケーション間でサイロ化したデータを分析するとき、特にマルチクラウドとデータレイクの相互運用性が欠如しているときや、データ分析エコシステムをサポートするためにバラバラなツールとサービスを組み立てる必要があるときです。最新のOracle Autonomous Data Warehouseイノベーションにより、お客様はデータの場所に関係なく、簡単に問合せ、管理、共有およびスケーリングできます。私たちは、データ管理システムで可能なことの限界を押し広げ、すべての主要なデータベースワークロードとデータタイプのパフォーマンス、自動化、マルチクラウド統合を実現し続けます。」
— Oracle、データウェアハウスおよびAutonomous Databaseテクノロジ担当、エグゼクティブ・バイス・プレジデント、Çetin Özbütün
この度、Autonomous Databaseに導入される重要な新機能を発表します。これにより、このサービスはより使いやすく、よりオープンになると考えています。ここでは、発表の概要を説明し、より詳細な情報を提供する他の投稿やデモを紹介します。新機能は、以下の分野に分類されます:
- マルチクラウド・データ・ウェアハウス
データへのアクセスを簡素化します。クラウドおよびオンプレミスにわたるあらゆるデータベースやオブジェクト・ストアに格納されているデータへのアクセスが簡単です。 - Autonomous Database Data Studio
データのインテグレーションおよび変換を簡素化します。100を超えるデータ・ソースからのデータを分析するための使いやすいツールを提供します。 - データ・レイクの見直し
アナリティクスの大部分は、SQLアプリケーションを使用して行われます。大量のデータを、素早くSQLでアクセスするのに最適化された方法で保存することで、新たに経済的なメリットが得られます。 - オープン・データ共有
組織内外の関係者とデータを安全に共有することで、コラボレーション、意思決定、データ製品の提供を簡素化することができます。
マルチクラウド・データ・ウェアハウス
ほとんどのお客様が、クラウドとオンプレミスのデータ・センターにデータを分散しています。すべてのデータを統合的に表示することは、より適切な意思決定にとって重要です。Autonomous Databaseは、OCI、AWS、Azure、Google Cloudのオブジェクト・ストレージへの安全なアクセスに加え、Azure SQL、Azure Synapse、Amazon Redshift、Snowflake、MongoDB、Apache Hive、PostgreSQLへの直接データベース接続によって、マルチクラウド・データ・ウェアハウスを簡素化します。また、データレイク・スキーマやメタデータを自動的に取得するため、Apache Icebergのテーブルへのクエリ・アクセスやAWS Glueとの連携などサービスを拡張しています。

あらゆるタイプのデータへのシンプルでセキュアなマルチクラウド・アクセス
データ・レイクのソースは複雑になりがちです:
- 各クラウドではそれぞれ独自の方法で、オブジェクト・ストアへのアクセスを管理している
- データの取得には様々なファイル形式、Parquet、ORC、CSV、JSON、Avroなどがある
- オブジェクトストアのデータの論理的な構成には、適切に解釈することが重要なセマンティックが含まれていることが多い
Autonomous Databaseは、データレイクのソースにアクセスする際、これらの複雑さをネイティブに理解します。各クラウド・プロバイダのIDおよびアクセス管理との統合により、データ保護が確実にすることができます。シンプルなAPIにより、Oracle SQLを使ってこれらのソースにアクセスする表を作成でき、ウェアハウスとデータレイク全体のデータをシームレスにデータを分析できます。アプリケーションは、データレイクで起こっている処理から完全に隔離され、普段どおりに動作します。
Autonomous Databaseは以前からOCIデータ・カタログと緊密に統合されています。AWS Glueカタログのサポートも同様に近日中に提供される予定です。データ・カタログの統合により、管理タスクが大幅に簡素化されます。データ・レイクのメタデータはAutonomous Databaseと自動的に同期されるため、レイク内のデータはすぐに問合せに使用できます。データ・レイクをウェアハウスの自然な拡張と考えることができます。データを物理的に移動することなく、Autonomous Databaseに格納されたデータとオブジェクト・ストアに格納されたデータを結合するSQL問合せを実行できます。
Autonomous Database Data Studio
データの統合と変換が容易
前述のとおり、Autonomous Databaseは、データを統合および分析するための豊富なAPIセットを提供します。Data Studioは、組み込み、セルフサービス、ノーコード・ユーザー・エクスペリエンスで、IT部門の助けを借りずにソリューションを開発できます:

たとえば、スプレッドシート、データベースまたはデータ・レイクからデータをロードするのに、単純なドラッグ・アンド・ドロップ操作でできます。ソースに関する情報は自動的に導出されます:

次に、Data Studioがジョブを開始して、ターゲット表を定義し、ソースからデータをロードします。これだけで、データの分析を開始する準備が整いました。
しかし、データ・ソースがより複雑な場合はどうなるでしょうか。SalesforceやOracle Fusionなどのエンタープライズ・アプリケーション、NoSQLストア、あるいは単にRESTエンドポイントから利用できるデータかもしれません。また、そのソース・データは、他のデータ・ソースと組み合せたり、ユーザーに提示する前に、整理する必要があるかもしれません。
Data Studioへの大幅なアップデートにより、これらのソースの統合が劇的に容易になりました。Data Studioでは、様々なタイプのストアで100を超えるデータ・ソースがサポートされるようになりました。サポートされているソースのスナップショットを次に示します:

様々なソースのサポートに加えて、新しい変換機能により、要件を満たすようにデータを切り替えることができます。変換は簡単に構成でき、ジョブ実行はAutonomous Databaseのパフォーマンスとスケーラビリティを活かします。

フィルタ、集計、結合、ルックアップ、さらには機械学習、空間関数、グラフ関数など、ワークフローに適用できる変換関数は多岐に渡ります。これはすべて、コードを1行も記述せずに実行できます。
Googleスプレッドシート用アドオン
誰もがスプレッドシートを愛用しています – これまでも、これからも。しかし、しばしば会議中にいくつかのスプレッドシートの数字が一致しないことがあるのではないでしょうか?
代わりに、信頼できる唯一の情報源に基づいて信頼できる意思決定を行います。Microsoft ExcelおよびGoogle Sheets用のData Studioのプラグインは、Oracle Autonomous Warehouse内のデータに直接接続します。シンプルなウィザード・ベースのインタフェースで、データベースに格納されている組込みの分析ビューから、組織のディメンション・データおよびメトリックをGoogle Sheetsピボット・テーブルに取り込みます。ビジネス定義(階層やメトリックなど)とデータ値の両方がすべてのユーザーおよびアプリケーション間で共有されるため、一貫性が確保されます。

データ・レイクの見直し
データレイクの出現はビジネスにとって大きな変化でした。低コストのストレージにより、従来は破棄されていたデータを保管して利用することが可能になります。コンピュートとストレージを切り離すことで、リソースの使用が大幅に効率化されました。また、SparkやPythonなどのオープンソース・ツールやフレームワークにより、データのロードや変換、機械学習の使用が容易になりました。新しいデータの学習にかかるコストはずっと低くなり、新しい可能性が生まれました。
しかし一つだけ変わらなかったことがあります。誰かがSQLクエリを直接書いたり、Power BIやOracle Analytics CloudのようなSQLを裏で使うツールを使ったりと、分析の大部分は依然としてSQLを使用しています。従来のデータ・レイクでもSQLを使用できますが、SQLパフォーマンスの最適化ではなく、コストの削減に重点を置いています。データ・レイクのすべてのメリット、特にストレージとコンピューティングの分離のコストが低い上で、パフォーマンスが劇的に高速であるとしたらどうでしょうか。
Autonomous Data Warehouseのストレージ・コストを75%下げたことにより、今では、データ・レイクのアーキテクチャを見直し、SQL分析に必要なすべてのデータをAutonomous Data Warehouseに保存することができます。Oracle Autonomous Data Warehouseの高度に最適化されたストレージは、オブジェクト・ストレージと同じ価格でありながら、最大20倍高速な問合せパフォーマンスを実現します。これにより、データ・レイクのアーキテクチャに柔軟性が生まれ、すべてのデータをAutonomous Data Warehouse、あるいはオブジェクト・ストア、またはその両方に保存できます。要件に基づいて、最適なアーキテクチャを選択できます。
Open Data Sharing
データを共有する従来の方法は、本質的に複雑で安全ではありません。データをCSVファイルにアンロードし、Eメールまたは共有先にコピーしてファイルを共有します。ガバナンスやセキュリティがなく、データの体系的なリフレッシュや最新のビューもありません(前述のスプレッドシートのジレンマを参照)。
Autonomous Databaseは、組織内外の関係者とデータを共有するための、より優れた方法を提供します。Open Data Sharingでは、データ所有者は「データ共有」を作成し管理できます。データ共有は、データ・セット(または表)の集合と考えることができます。データ所有者は、その共有の内容と、読み取ることができるユーザーを定義します。共有の受信者は、データが使用可能になったという通知を受け取り、その集中管理されたデータにリモートでアクセスします。データは安全で、管理され、常に最新の状態です。様々なツールを使用してそのデータを分析できます。以下では、Power BIユーザーが共有内のデータを分析している様子を紹介しています。

Open Data Sharingは、共有データの持ち主との連携の在り方に革命をもたらします。あなたのデータは、真に価値ある資産として扱われるようになるのです。同僚やパートナーは、信頼できるデータを使ってより良い意思決定をすることができます。データ資産をこれまで以上に簡単に収益化することができます。
まとめ:
今回は、Autonomous Databaseの新機能を簡単にまとめてみました。これらのアップデートが、組織にとって非常に価値のある資産であるデータを活用するための一助になれば幸いです!
Autonomous Databaseの最新の機能拡張については、以下のリソースをご覧ください :
ブログ:
- 業界をリードするアナリストとお客様が最新のAutonomous Data Warehouseイノベーションについてコメント
- Oracle Autonomous Databaseのデータ共有による無制限のデータドリブンのコラボレーション
- Data Studioの概要
- データ変換の概要: Autonomous Databaseのための組込みデータ統合
- Oracle Autonomous Data Warehouseによるデータレイクの再考
デモ:
プレス・リリース:

