※ 本記事は、Pradeep Vincent, Egor Pushkinによる”First Principles: OCI AI Agent Platform is a New Frontier for Enterprise Automation“を翻訳したものです。

2025年8月20日


Oracle Cloud Infrastructure (OCI) AIエージェント・プラットフォームは、エンタープライズAIの重要な開発であり、高度なAIシステムのためのマネージド・プラットフォームを提供します。LLM検索拡張生成 (RAG)、ツール・オーケストレーションを組み合わせることで、AIエージェントは複雑なタスクを自律的に実行できます。このサービスは、データベースやクラウド・インフラストラクチャなど、Oracleスタック全体でシームレスに統合されるため、効率的なデータ取得とAPIインタラクションが可能になります。この統合により、ビジネス・プロセスと連携して、より迅速かつ安全なAI実装が可能になります。Oracleは、エコシステムの活用とセキュリティの優先順位付けに重点を置いており、業界や自律型AIエージェントの分野におけるリーダーになることができます。OCI AIエージェント・プラットフォームにより、企業は、Oracleエコシステム全体でシームレスに統合するインテリジェントでセキュアなコンテキスト対応エージェントを構築できます。

はじめに、歴史と進化

生成AIは急速に進化し、企業内では実験から必須へと移行し、さまざまな産業に革命をもたらしました。コンテンツ作成と言語理解における最初のアプリケーションは拡大しており、ソフトウェア開発と運用効率に大きな影響を与えています。この技術は、コーディング支援からレポート合成まで、多くのタスクを自動化し、合理化しました。今、焦点は、エージェントAIに向けて前進し、AIエージェントをより広範なワークフローに統合し、意思決定を行い、リアルタイムのコンテキストに基づいてアクションを実行するように構成することを目指しています。この進歩は、AIの進化の重要な一歩であり、よりインテリジェントで適応性の高いシステムへと移行します。

Agentic AIとは?

エージェント型AIは、LLM機能を高度な推論、メモリ、ツール・オーケストレーションと統合することで、複雑なプロセスを自律的に管理するように設計されたインテリジェントなシステムを実現します。単純なプロンプトベースのシステムとは異なり、エージェントは複数のステップを経て作業し、関連情報を取得し、外部APIを呼び出して、対話履歴に基づいて適応できます。エージェント・システムは、機械学習とディープ・ラーニングの着実な進化の結果です。

生成AIの開発には重要なマイルストーンが刻まれています。ディープ・ラーニングと機械学習はLLMにつながりました。具体的には、自然言語処理におけるトランスフォーマー・モデルの採用により、大規模言語モデルへの道が開かれました。以前は、LLMがシングルステップ・タスクに利用され、コンテキスト・メモリーのないテキストが生成されていました。その後、ファインチューニングされたLLMがドメイン固有の活動のために出現し、精度が向上しました。その後、RAGにより、AIは外部の知識にアクセスできるようになり、信頼性が向上しました。統合ツールの使用により、APIやデータベースと対話するためのモデルを強化し、パッシブ・アシスタントを問題解決者へと変革しました。最後に、Agentic AIはこれらの進歩を組み合わせ、複雑なマルチステップのワークフローや自律的な意思決定のためのインテリジェントなエージェントを構築します。この進歩により、生成AIの機能は向上し、汎用性とパワフルなエンタープライズ・ツールとなっています。

Timeline of OCI path from Generative AI to Agentic AI
図1: 生成AIからエージェントAIへの進化

これらの5つのフェーズをまとめて、エンタープライズAIが、孤立した1回かぎりのタスクから、複雑で動的で有意義な問題解決プロセスに従事できるインテリジェントなシステムへとどのように進んだかを示します。

エージェントは、次の3つの構成要素で構成されます:

  1. 計画 – プロンプトの指示、会話履歴および外部コンテキストに基づいて段階的に決定する機能。これには、反射、自己批判、思考連鎖、サブゴール分解などの手法が含まれます。
  2. ツールの使用 – 外部ツール、APIおよび機能との統合により、アクションを実行できます。通常、エージェントは各ステップで、検索エンジン、ベクトル・ストア、データベースなどのツールと相互作用するか、APIコールを実行します。
  3. メモリー – 複数のインタラクションについて状況に即した認識がもたらされます。これは、短期(セッション内で最新のユーザー入力を保持するなど)または長期(セッション間でユーザー・プリファレンスや過去のタスクを記憶するなど)です。

Diagram of AI Agent capabilities
図2: エージェントのコア・コンポーネント

AIエージェント 対 自動化ワークフロー

技術面では、エージェントは複数のLLMコールのパイプラインであり、それぞれがインテントの解析、ツールの選択、データの取得、結果の評価および応答という個別のステップを実行します。アーキテクチャ上、エージェントは強力でありながらモジュール式であり、エンタープライズ・アプリケーションに最適です。

従来の静的ロボティック・プロセス・オートメーション (RPA)や厳格なワークフロー・オートメーションとは異なり、エージェントは動的で適応性が高く、状況の変化や様々な入力にリアルタイムで対応できるように設計されています。この柔軟性により、エージェント・テクノロジをドメイン全体で広く適用できるようになり、大規模な事前構成または統合の必要性が軽減されます。その結果、組織はインテリジェントなソリューションをより迅速に導入し、運用上の変動に対する耐障害性を高めることができます。

Architectural diagram of how LLMs trigger agent execution
図3: RAGツールを使用したエージェント実行全体でのLLMの活用

エージェントAIパイプラインには、必要な結果を取得したり目的を設定するために動的に起動される複数のエージェントとそのサブプロセスを含めることができます。これには、完全に自律的なエージェントと、ループに人間が関与するエージェントを含めることができます。

エージェント定義からデプロイメント: エンドツーエンドのフレームワーク

OCI AI Agent Platformは、AIエージェントを構築およびデプロイするためのシームレスでフルマネージドな環境を提供します。このプラットフォームは、インフラストラクチャとオーケストレーションの複雑さを抽象化し、開発者が設計とロジックに集中できるようにします。

OCI AIエージェント・プラットフォームを使用して新しいエージェントをプロビジョニングする場合、エージェントの機能のあらゆる側面を構成するのに役立つ、リッチでモジュール化された設計フレームワークがユーザーに提供されます。通常、この構成プロセスは、エージェントの動作、インテリジェンスおよび統合の可能性を形成する4つのプライマリ・ディメンションから始まります: (a)ナレッジ・ベースの定義、(b)エンド・ポイントの構成、(c)ツールの使用の有効化および (d)モデル選択。

Core Agent capabilities within OCI AI Agent Platform
図4:OCI AI Agent Platform内のエージェントの主な機能

最初のステップは、エージェントがアクセスできるナレッジ・ベース (KB)の定義です。これらは、エージェントがエンタープライズ・ナレッジと対話する方法の基本です。ナレッジ・ベースは、内部ドキュメント、ヘルプ・センターの記事、オンボーディング・ガイドなどの非構造化データ、または表形式の財務レポートなどの構造化データセットで構成されます。主な例はOracle Database 23aiです。これは、従来のSQL構造とベクトル拡張検索機能を組み合せたセマンティック対応のナレッジ・ソースとして機能します。ドキュメントやメタデータを検索可能な埋込みに索引付けすることで、開発者は、大規模な情報リポジトリ全体から、より関連性の高い根拠のある回答を使用して、エージェントをよりよく理解し、対応できるようになります。

2番目のステップはSQLエンドポイントを構成することです。これにより、エージェントは自然言語を使用してリレーショナル・データベースの構造化データと直接対話できます。この設定では、分析、レポート、コンプライアンス問合せ、リアルタイム・ステータス・チェックなど、様々なユースケースがサポートされます。埋込みNL2SQLツールは、問合せの説明、スキーマ・リンク、自己修正などの組込み機能により、ユーザー・インテントを実行可能なSQL問合せに変換できます。これにより、たとえば、営業担当者は「前四半期の収益を生み出す上位3つの製品は何ですか?」と質問し、Oracleデータベースに対する最適化されたSQL問合せに変換できます。

3番目のステップは、特定のドメイン・ロジックに合せたカスタム・ツールを定義することです。これらのツールは、内部マイクロサービス、ワークフローAPI、または外部のSaaSエンドポイントを表すことができます。開発者は、セキュアに定義されたインタフェース(通常はOpen API仕様を使用)を通じて機能を公開できるため、エージェントはサービス・チケットの作成、カレンダ・イベントのスケジュール、独自のCRMシステムからのデータの取得などのアクションをトリガーできます。Oracleのプラットフォームは、セキュアで認証されたコールをサポートし、ユーザー・ロールまたはエージェント・コンテキストに基づくツール起動制御を可能にします。

もう1つの重要な構成ステップとして、指示(エージェントのトーン、レスポンス戦略およびエスカレーション・プロトコルをガイドする動作ブループリント)の指定があります。これに加えて、エージェント作成者は、特定のユース・ケースに沿ったモデル選択戦略を定義します。OCI AI Agent Platformは、LLaMA、Cohere、OpenAIなどの幅広いLLMをサポートし、それぞれに精度、レイテンシ、コストのオプションを提供します。これらのプロビジョニング・ディメンションを組み合せることで、リッチなカスタマイズが可能になり、OCIを介してデプロイされるすべてのエージェントが専用の状態で構築され、データ・セキュリティが厳密に管理され、企業の準備が整うようになります。

エージェントがプロビジョニングおよび構成されると、専用エンドポイントを介してアクセス可能な完全管理型の本番グレードのサービスとしてデプロイできます。このエンドポイントは、エンド・ユーザーおよびクライアント・アプリケーションがブラウザベースのチャット・インタフェース、アプリケーションの埋込みウィジェット、またはRESTful APIを介してプログラム的にエージェントとやり取りできるライブ・インタフェースとして機能します。エンドポイントは、メッセージ・ルーティングの処理、会話型コンテキストの維持、およびマルチターン・インタラクションの有効化を目的としています。

たとえば、財務アプリケーションにプロビジョニングされたサポート・チャットボットは、ユーザーが「最新の払戻のステータスは何ですか?」などの質問ができるポータルを介して表示される場合があります。エージェントは、OCIが提供するセキュアなエンドポイントを通じて、入力を処理し、適切なデータを取得し、会話的に応答します。

Flowchart of Agent provisioning process.
図5: エージェントのプロビジョニング・プロセス

セキュリティとプライバシー: 組み込み、ボルトなし

エージェント型AIは、強力でエキサイティングな機能を企業にもたらしますが、セキュリティが第一です。企業は、プライバシー、コンプライアンス、またはデータの整合性を損なう余裕がありません。これを認識すると、OCI Generative AI Agents Serviceは、後から考えるのではなく、スタックのあらゆるレベルでセキュリティをゼロから構築されています。データの取り込みからレスポンスの生成まで、プラットフォームのすべてのレイヤーに、機密情報の保護、ポリシーの境界の徹底、信頼の促進を目的として設計された堅牢なコントロールが組み込まれています。このセキュリティファーストの設計により、企業は最も規制されている環境でもインテリジェント・エージェントを自信を持って導入できます。

実行時に、エージェントは分離されたセキュアな環境にデプロイできます。OCI AI Agent Platformは、専用の推論インフラストラクチャとテナント・データの厳密な分離をサポートしています。ヘルスケアや財務などの規制対象業界に不可欠です。

ガードレール・エージェント

エージェントには、行動を制限し、組織の規範を施行するガードレールを含めることができ、安全性の2つの重要な側面(リクエストの理解と応答の検証)に重点を置いています。

入力側では、ガードレールは、エージェントが要求をより正確かつ安全な境界内で解釈するのに役立ちます。たとえば、リクエスト解析メカニズムは、ユーザー・インテントが正しく抽出され、許容可能な操作と一致していることを確認するのに役立ちます。SQLエージェントの場合、これは、自然言語の質問を意図しない結果なしで安全にSELECT問合せに変換できるかどうかを検証することを意味する場合があります。

出力側では、エージェントが返す内容が関連性があるだけでなく、コンプライアンスに準拠し、状況に応じて適切であることを確認するために、レスポンス検証が不可欠です。検索拡張生成 (RAG)パイプラインでは、引用されたソースが正しく帰属していること、現実のデータ参照によってハルシネーションが最小化されていること、生成されたレスポンスが予想されるフォーマットまたはビジネス・ロジックに対して検証されていることの確認が含まれます。

クライアント側の実行

クライアント側のファンクション呼出しは、エージェントがクライアント・テナンシ内で機密性の高い職責(認証、認可、ネットワーキングなど)を維持しながら、顧客管理APIとインタフェースできる強力な機能です。このアプローチは、内部システムへのアクセス方法およびアクセス時期を厳密に制御する必要がある企業にとって特に重要です。

この設定により、エージェントの推論と意思決定(ユーザー・インテントの解析から起動するツールの決定まで)は、すべてOracleのバックエンドで実行されます。エージェントの推論エンジンによって特定の機能が選択されると、呼出しは実行のためにクライアントの環境に安全に委任されます。

クライアントは、外部エージェントが選択したツールまたは機能に、独自の資格証明、エンドポイントまたはファイアウォール・ルールを使用してアクセスでき、それらのリソースをエージェントに公開する必要はありません。クライアントは、APIの呼出し方法、使用されるアイデンティティ、および適用される制約の所有権を保持します。この懸念の分離は、外部アクションのシームレスなオーケストレーションを実現しながら、セキュリティとコンプライアンスの境界に対処するのに役立ちます。

ハルシネーションの防止

OCI AIエージェント・プラットフォームでは、ハルシネーションの防止は主に、エージェントの応答が関連性があるだけでなく、検証可能かつ正確なデータに基づいていることを確認できるようにすることを目的としています。Oracleは、この課題に対して多層的なアプローチをとり、推測を減らし、応答の整合性を強化するために、ツールチェーンと実行ライフサイクル全体に保護を埋め込みます。

SQLベースのインタラクションのコンテキストでは、エージェントの動作を厳密なスキーマ定義に根ざすことで、ハルシネーションが軽減されます。SQL生成を明確に定義されたスキーマ(表名、列タイプおよび許可される操作)にリンクすることで、エージェントが無効または投機的な問合せを生成できないようにするのに役立ちます。さらに、自己修正メカニズムは、ユーザーが介入することなく、エージェントがSQL実行のエラー(構文の問題や参照の欠落など)を検出し、それに応じて問合せを修正できるように設計されています。これにより、エージェントが構造化データとやり取りする際に、レジリエンスと信頼性の重要なレイヤーが追加される可能性があります。

RAGが関与するシナリオでは、事後検証と引用チェックを組み合わせることで、幻覚防止をより良く達成することができます。取得した文書を使用してドラフト応答が生成されると、表示される情報がソース資料に存在する情報と一致するかどうかが検証されます。エージェントが行った各事実または主張は、透明性をサポートするためのインライン引用を含む特定の段落または文までさかのぼることができます。これは、コンテンツの検証に役立つだけでなく、エンド・ユーザーとの信頼の構築にも役立ちます。

カスタム・ツールおよびAPIの場合、エージェントは定義済の関数および予想される出力に制限できるため、投機的または不正確な情報を生成する可能性が低くなります。これらのツールは構造化レスポンス(JSONペイロードなど)を返すため、エージェントの生成レイヤーは、既知のパラメータおよび検証済出力の範囲内に留まるように指示できます。

これらの手法(スキーマに制約のある生成、実行対応の自己修正、引用ベースの検証、および決定的なツール・レスポンス)をまとめて使用すると、ハルシネーションを軽減し、高品質のエージェント出力を提供するための包括的なフレームワークを形成できます。

Oracleエコシステム統合

OCI AI Agent Platformは、Oracleエコシステム内のブリッジと基盤の両方として機能します。Oracleのネイティブ・テクノロジと深く統合されており、セマンティック検索のベクトル検索や構造化問合せのネイティブSQLエンジンなど、Oracle Databaseの高度な機能を活用しています。また、より広範なOracle applicationsとサービスが構築される基盤レイヤーとして機能します。Oracle Fusion、NetSuite、Database 23aiなどのアプリケーションは、インテリジェント・エージェントをワークフローにネイティブに組み込み、パーソナライズされたコンテキスト対応のユーザー・エクスペリエンスとプロアクティブなユーザー・エクスペリエンスを実現します。

例を挙げてみましょう。従業員が現在の年の残りの控除額について問い合せると、バックグラウンドで次のようになります:

Flowchart of Fusion HCM Benefits Advisor agent powered by OCI AI Agent Platform.
図6: OCI AIエージェント・プラットフォームを搭載したFusion HCM Benefits Advisorエージェント。

このフローは、シームレスな統合と、OCI AI Agent Platformと使用するアプリケーション間の責任の明確な分離を示しています。機密システム・データを操作する際に、セキュリティ対策をどのように維持できるかを強調します。プロセスは次のように展開されます:

  1. 従業員は、リクエストを送信してインタラクションを開始します。
  2. エージェント・サービスは、リクエストを分析し、順次実行される一連のサブタスクに分解します。
  3. 最初のサブタスクでは、関連する詳細を取得するために必要な適切な関数を特定します。
    • 対応するAPIコールの実行は、Fusion環境内のオーケストレータに委任されます。これにより、すべてのコールを適切に認可でき、HCM APIをエージェント・サービスに直接公開する必要がなくなります。
  4. エージェントは、適切なナレッジ・ベースから福利厚生プラン詳細を取得します。
  5. 最後に、計算ツールを起動して結果を計算します。この計算ツールは、レスポンス生成パイプラインを介して渡され、ユーザーに返されます。

このインタラクション全体はエンド・ユーザーから抽象化され、アーキテクチャはFusionアプリケーション全体にわたる幅広いツールとナレッジ・ベースの組合せをサポートします。

OCI AI Agent Platformは、インテリジェント・エージェントをワークフローに直接埋め込むことで、さまざまなOracle applicationsを強化し、自然言語でのやり取りとプロアクティブな支援を実現します。Fusion AI Studioを使用すると、開発者はFusionアプリ内でエージェントを視覚的に構成できます。Database Select AIを使用すると、プレーンな英語をSQLクエリに変換できます。NetSuiteとAsk Oracleは、会話型の財務と運用に関するインサイトを提供します。OCIサポートは、検索拡張生成 (RAG)およびAPIを使用して、問題解決を自動化します。Smart Contact Centerは、リアルタイムのAIガイダンスによりライブ・サポートを強化し、Oracle Code Assistはインテリジェントなコード提案を通じて開発者の生産性を合理化するのに役立ちます。これらの機能を組み合わせることで、セキュアでスケーラブルなコンテキスト対応のインテリジェンスをOracleのエコシステムのすべてのレイヤーに提供できます。

これらの機能を併用することで、エージェント・インテリジェンスをOracleアプリケーション環境に埋め込むための包括的な基盤を形成できます。FusionのHRマネージャを支援する場合でも、NetSuiteの財務アナリストを指揮する場合でも、Smart Contact Centerを通じてサポート・エンジニアを支援する場合でも、開発者のIDEでコード配信を加速する場合でも、OCI AIエージェント・プラットフォームは、インテリジェント・エージェント・フローをビジネスクリティカルな環境に一貫性があり信頼性が高く安全な統合を提供できます。

エージェントAI環境は急速に進化しており、新しいパラダイム、ツール・メソッド、オーケストレーション戦略はほぼ毎月のように登場しています。今後、AIエージェント業界は、カスタム・ハードウェアおよび独自のLLMモデルをサポートし、Deep Researchなどの新しいエージェント・パターンを組み込み、マルチエージェント・トポロジを統合する可能性を秘めています。

重要なポイント

  • OCI AI Agent Platformにより、企業は生成AIを活用して、インテリジェントでセキュアなコンテキスト対応エージェントを構築できます。
  • エージェントは、ナレッジ・ベース、SQLエンドポイント、カスタム・ツールおよび動作命令の宣言的構成を使用してプロビジョニングされます。
  • セキュリティ対策はフレームワーク全体に組み込まれています。エージェント・ガードレールおよびハルシネーションの防止は、スキーマの制約、事後検証および引用ベースの検証によって実施される主要な設計原則です。
  • OCI AI Agent Platformには、Database 23aiなどのOracleテクノロジとのネイティブ統合が付属しており、シームレスなコンテキスト内自動化を提供するように設計されたFusionやNetSuiteなど、Oracle applicationsの基礎となるビルディング・ブロックを形成できます。

参照

  1. エージェントAIへの道: Oracleと最先端のモデル・プロバイダとのコラボレーション・アプローチ
  2. OCI Generative AI Agents Platform提供開始の発表
  3. 舞台裏: OCI生成AIエージェントを使用したコンテキストの正確性の向上
  4. First principles(第1原則): OCI Generative AI Serviceの深さを探る