※ 本記事は、Alexey Filanovskiyによる”Introducing Data Lake Accelerator: Boosting External Data Performance with Oracle Autonomous AI Database“を翻訳したものです。
2025年11月4日
現代の企業は、膨大なデータを生成・活用しており、その多くは複数のプラットフォームやクラウドに分散しています。OCI Object Storage、Amazon S3、Google Cloud Storage、Azure Blob Storageといったオブジェクト・ストレージは、多くの組織のデータ・エコシステムに不可欠な存在です。これらは、Apache Icebergのような最新のテーブル形式やその他のファイル形式を含む大量データを、低コストかつ手軽に保管できる場所を提供します。分散したデータセットからタイムリーに価値を引き出すには、データを移動・統合するという高コストで複雑なプロセスを伴うことなく、分析、AI、機械学習、レポーティングのために、複数のエンジンやツール間でデータへ直接アクセスし、効率的に処理・共有する必要があります。
Autonomous AI Databaseは、企業の事業運営に不可欠であるクリティカルなデータを取り込みます。これにより、オペレーショナル・データとオブジェクト・ストレージ上のデータをシームレスに組み合わせ、複雑な連携やデータ移動を不要にして高度な分析を可能にします。新たに導入された Data Lake Acceleratorにより、Oracle Autonomous AI Databaseは、クエリ要件に応じてリソースを動的にスケールさせる柔軟でコスト効率の高いソリューションを提供し、オブジェクト・ストレージ上のデータに対する問合せの高いスケーラビリティの性能ニーズに応えます。
Autonomous AI Database Data Lake Acceleratorとは?

Data Lake Acceleratorの動作イメージ
Autonomous AI Database Data Lake Acceleratorは、外部データ処理タスクのパフォーマンスとスケーラビリティを向上させるために設計された機能です。Autonomous AI Databaseに統合された機能で、オブジェクト・ストレージ上のデータのスキャンと処理を高速化するためにコンピュート・リソースを自動的に割り当て、次の特長を提供します:
- 動的スケーラビリティ: Autonomous AI Databaseの基本構成を補完する形で、追加のCPUを自動的に増設してリソースをスケールします。
- パフォーマンス最適化: 外部データのスキャンを加速し、クエリ応答時間を短縮。大規模な外部データセットをより効率的に分析できます。
- ワンクリック有効化: 進行中のデータベース運用を中断することなく、Autonomous AI DatabaseのコンソールまたはAPIから即時に有効化できます。
- コスト効率: 動的なCPU割当てにより、使用したリソース分だけ支払います。さらにBYOL(Bring Your Own License)料金を活用でき、コストを一段と削減します。
Data Lake Acceleratorの仕組み
外部データに対するクエリが送信されると、Autonomous AI Databaseは必要な計算量を評価します。追加リソースが必要と判断されれば、Data Lake Acceleratorが必要なCPUを動的に割り当て、処理時間と総コストの両方を削減しつつ、効率的なリソース活用を実現します。
この裏側では、ユーザーが操作することなく、Autonomous AI Databaseによって追加の仮想マシン(VM)が自動プロビジョニングされます。これらのVMにより、Autonomous AI DatabaseはObject Storeからの読み取りを高い並列度で実行でき、クエリ性能を大幅に加速します。この並列処理は、CSV、JSON、Parquet、ORC、そして特にデータレイクで最新かつ広く採用されているテーブル形式であるIcebergを含む、さまざまなファイルタイプで機能します。
Data Lake Acceleratorの始め方
Data Lake Acceleratorは、Autonomous AI Databaseに統合された標準機能のため、簡単に有効化できるパフォーマンス向上機能です。一度有効化すると、Autonomous AI Databaseがリソースを自動かつ動的に管理します。
Cloud Consoleの「Tools」メニューからData Lake Acceleratorの有効化/無効化を行い、割り当てるコンピュート量を指定してください。

データ処理を加速させませんか?
Autonomous AI Database Data Lake Acceleratorは、Oracle Autonomous AI Lakehouseの機能と、Iceberg(最新のデータレイク向けの代表的なオープンテーブル形式)などのオープンソース・コンポーネントや、オブジェクト・ストア上のその他のファイル形式を組み合わせる上で重要な役割を果たします。Autonomous AI Databaseの外部テーブルキャッシングと併用することで、卓越したパフォーマンスと自動リソース管理を実現し、既存のクエリを一切変更することなく、データからのインサイトをより簡単に、効率的に、そしてコスト効率よく得られるようにします。
