※ 本記事は、Doug Hood, Ranjan Priyadarshiによる”Oracle Announces General Availability of AI Vector Search in Oracle Database 23ai“を翻訳したものです。
2024年5月7日
Oracle AI Vector Searchは、従来サポートされていたデータベースと同様に、属性値やキーワードなどのデータ値によってだけでなく、データのセマンティクスや意味に基づいてデータを検索できる新しい機能です。
ベクトル(ベクトル埋め込み)は、AIアプリケーションで使用される一般的なデータ構造です。ベクトルは、データのセマンティクスをエンコードする様々なデータ型(イメージ、ドキュメント、ビデオなど)のディープ・ラーニング・モデルによって生成される数値のリストです。
Oracle AI Vector Searchでは、SQLのフルパワーを使用して、ベクターの埋込みを他のビジネス・データとともに生成、格納、索引付けおよび問合せできます。たとえば、ドキュメントを検索する場合、ベクトル検索はキーワードベースの検索よりも効果的とみなされます。ベクトル検索は、実際の単語自体ではなく、単語の背後にある意味とコンテキストに基づいているためです。
Oracle AI Vector Searchでは、セマンティック・ドキュメント検索を構造化ドキュメント・プロパティの検索と組み合せることができます。たとえば、テクノロジ記事のデータベースでは、「過去5年間に特定の著者および特定の国の特定の発行者によって公開されたエンタープライズ・ユース・ケースのLarge Language Models (LLM)のfine-tuningに関する記事の検索」などの質問があり、1つ以上の表に存在する可能性のある記事テキストおよび記事属性の両方を検索する必要があります。
Oracle AI Vector Searchには、ビジネス・ユース・ケースのセマンティック検索を可能にする強力な機能のコレクションが含まれています。次のような機能があります
- 非構造化データからベクトル埋込みを生成するための新しいSQL演算子
- ベクトル埋め込みを格納するための新しいファーストクラスのVECTORデータ型
- 最新のベクター索引による近似検索の高速化
- ビジネス問合せで類似性検索を簡単に表す新しいSQL演算子および構文
- 前処理およびベクトル化データを含むフル・ジェネレーティブAIパイプラインのサポート、ビジネス・データによるLLMの拡張
VECTORデータ型は、SQLおよびPL/SQLに完全に統合されており、python-oracledb、node-oracledb、JDBCおよびODP.NETドライバのネイティブ・バインディング機能を備えた複数のクライアントおよびプログラミング言語でサポートされています。この包括的なサポートにより、複数の開発環境でシームレスなベクトル検索機能が提供されます。
Oracle AI Vector Searchは、LangChainなどの一般的なサード・パーティGenerative-AIフレームワークにも完全に統合されています。
Oracle AI Vector Searchには、コンテンツ生成(テキストなど)や要約、Generative-AIパイプラインで使用されるその他の操作のために、RESTからLLM APIへのコールアウトを行うネイティブAPIが含まれています。これらの新機能により、大規模な言語モデル(LLM)をプライベート・ビジネス・データで拡張し、ビジネス・データに関する自然言語の質問に正確な回答を提供する画期的な生成AI手法であるRetrieval Augmented Generation(RAG)をシームレスにサポートできます。
Oracle AI Vector Searchの利点
Oracle Databaseは、運用データとエンタープライズ・データの主要なリポジトリです。エンタープライズ・アプリケーションでは、通常、ビジネス・データと非構造化データの組合せを検索する必要があります。たとえば、小売Webサイトでは、自然言語の製品説明とターゲット製品イメージに基づく検索を、価格、店舗の場所、製造業者、現在の在庫状況などの他のフィルターとともに機能できます。この検索では、非構造化カタログ・データ(製品の説明とイメージ)、構造化カタログ・データ(価格、店舗の場所、製造業者)およびリアルタイムのトランザクション・データ(現在の在庫など)を同時に検索する必要があります。
Oracle DatabaseとOracle AI Vector Searchのコンバージド機能を組み合わせることで、いくつかのユニークなメリットが得られます。
AIベクトル・データとビジネス・データのシームレスな組合せ
Oracle AI Vector Searchでは、ビジネス・データを別のベクトル・データベースに移動するのではなく、既存のOracle Databases内でAIを利用したベクター類似性検索を実行できるため、これはOracle AI Vector Searchの主なメリットです。データの移動を回避することで、複雑さを軽減し、セキュリティを向上させ、現在のデータの検索を可能にすることができます。
Oracle AI Vector Searchでは、シンプルで直感的なSQLとコンバージド・データベース(JSON、グラフ、テキスト、リレーショナル、空間など)のフルパワーを使用して、高度なビジネス・データ検索とAIベクトルの類似性検索を組み合わせることで、ほとんどの専用Vectorデータベースよりもはるかに強力な検索が可能になります。
ビジネス・データによる取得拡張生成の強化
ベクトル・データベースは、より正確な回答を得るために、LLMにシナリオ固有のプライベート・コンテキストを提供するため、LLMとの相互作用を改善します。これは、Retrieval Augmented Generation (RAG)と呼ばれる既知のワークフローです。
また、Oracle AI Vector Searchでは、ビジネス・データの全機能を活用してLLMインタラクションをさらに改善し、セキュリティ・フィルタ、ビジネス・メトリック、ビジネス・ルールなどのビジネス基準を利用して、エンタープライズ向けの非常に高度なRAGを実現しています。
ビジネス・データのフル・ジェネレーティブAIパイプラインのサポート
Oracle AI Vector Searchは、ネイティブ・データベースAPIをサポートして、生成AIパイプラインのあらゆる側面をエンドツーエンドで実行できるため、開発者はOracle Database内でビジネス・データを使用して次世代のAIアプリケーションを簡単に構築できます。
AI Vector Searchとフル機械学習スイートのユニークな組み合わせ
Oracle Databaseは、データベース内の機械学習アルゴリズムの完全なスイートと、AIベクターの類似性検索の両方を提供します。この組み合わせにより、Oracle Databaseは、機械学習アクション(意思決定、予測、分類、予測など)やAIベースのベクトル検索の力を含む非常に幅広いAIユース・ケースを処理できます。たとえば、同じSQL問合せ内で推論と分類をAIベクトル検索と組み合せるのは簡単です。
実績のあるエンタープライズクラスのスケーラビリティ、耐障害性、セキュリティ
Oracle Databaseは、ビジネス・データの主要なリポジトリであり、ビジネス・データとセマンティック検索の組合せが、企業が人工知能ソリューションを実装するために必要なものです。AI Vector SearchはOracle Databaseに組み込まれており、次の点を活用しています:
-
パーティショニング、RAC、シャーディング、Exadataは、実証済の産業用の強力なスケーラビリティを実現します。
-
Data Guard、GoldenGate、フラッシュバック、RMAN、ZDLRAなどのきわめて高度なHAおよびDRテクノロジ。
-
Transparent Data Encryption、Key Vault、Audit Vault、Virtual Private Databaseなどの機能を含む、Oracle Advanced Securityによる最先端のセキュリティ。
ユース・ケースの例
Oracle AI Vector Searchでは、セマンティック・データとビジネス・データを組み合せて検索できるため、より正確な回答を迅速かつ安全に行うことができます。AI Vector SearchをOracle Databaseに追加することで、ユーザーはセキュリティ、データの整合性、パフォーマンスを犠牲にすることなく、人工知能のメリットを迅速かつ簡単に得ることができます。
ユース・ケースは次のとおりです:
- 会話型AI、またはチャットボット: AIを活用したデジタル・アシスタントを構築
- 類似性検索: 顧客と製品の照合
- コンテンツベースのフィルタリング: パーソナライズされたレコメンデーションを実現し、写真から小売アイテムを検索
- 自然言語処理: テキスト分類およびクラスタリングSQL生成
- データ分析: 異常検出、パターン認識
- コンピュータ・ビジョン: 顔認識、生体認証、物体検出
- 生物医学研究: 遺伝子/DNA類似性研究、分子構造探索
- 地理情報システム: 空間解析、マップ・レンダリング
- 産業アプリケーション: 品質管理、予知保全、機械の故障
まとめ
Oracle AI Vector Searchは、Oracle Databaseとともに、既存のビジネス・データで拡張されたLLMを使用してセマンティック検索を有効にすることで、従来のビジネス・プロセスを変換できる新しいクラスのアプリケーションを可能にします。
- 新しいSQL演算子および構文を使用し、ビジネス・データに対するリレーショナル検索と、非構造化データに対するセマンティック検索を簡単に結合
- Oracle Databaseを使用したAI搭載ベクトルの類似性検索 – ビジネス・データを別のベクトル・データベースに移動する必要なし
- Retrieval Augmented Generation (RAG)を簡単に利用して、企業固有のコンテンツでLLMレスポンスを拡張
- Oracle Databaseのエンタープライズクラスのセキュリティ、スケーラビリティ、およびパーティショニング機能でアプリケーションを拡張
詳細情報
Oracle DatabaseでのOracle AI Vector Searchの使用についてさらに学習するには、次を参照してください:
- 機能ページ: AI Vector Search
- ブログ: Oracle Database 23ai 提供開始の発表
