※ 本記事は、Gregory Kingによる”Announcing Fully Automated Disaster Recovery for Oracle Kubernetes Engine using OCI Full Stack DR“を翻訳したものです。
2025年5月8日
Oracle Cloud Infrastructure (OCI) Full Stack Disaster Recovery (Full Stack DR)は、Oracle Kubernetes Engine (OKE)のネイティブ・サポートを発表しました。OKEクラスタは、仮想マシン、ストレージ、ロード・バランサ、Oracleデータベースと同様に、Full Stack DRで選択可能なOCIリソースになりました。つまり、ITスタッフがスプレッドシートまたはテキスト・ファイルに1行のコードまたはステップバイステップの手順を記述することなく、OKE、インフラストラクチャおよびデータベースをリカバリする機能を検証、フェイルオーバー、スイッチオーバーおよびテストする方法を正確に把握しています。
プライマリ・リージョンとスタンバイ・リージョンの既存のOKEクラスタをFull Stack DRに追加し、1つのボタンをクリックするだけで、2つの異なるOCIリージョンまたは可用性ドメイン間で完全に自動化されたエンドツーエンドのフェイルオーバー、スイッチオーバーおよびDRドリルを編成するDR計画を数分で生成できます。
他のOCIリソースとOKEをFull Stack DRに簡単に統合して、システム、ネットワーク、データベース管理者が行うすべてのものを、スムーズで予測可能なリカバリやドリルを短時間で実現する単一のシームレスなワークフローに統合する、完全で包括的なリカバリ計画を作成できます。
ブラジルのヘルスケア業界のSoftware as a ServiceプロバイダであるBionexoは、Full Stack DRを使用して、OKEのディザスタ・リカバリを残りのアプリケーション・スタックとともに調整します。「BionexoがFull Stack DRを使用して、アプリケーション・スタック全体で30分間のダウンタイムとデータ損失ゼロでリカバリをオーケストレーションする方法」の詳細をご覧ください。
OKEのドリル、スイッチオーバーおよびフェイルオーバーのオーケストレーション
Full Stack DRは、通常、静的テキスト・ファイルまたはスプレッドシートで保守されるDRランブックを使用する場合と同様に、DR計画を作成して使用します。違いは、静的DRランブックでは、人間がそれらを見つけ、開き、正しいバージョンであることを確認し、OCIインフラストラクチャに加えられた最新の変更を反映させる必要があることです。
静的DRランブックは、OCIの本番環境の現実から完全に切り離されており、ITスタッフには時間のかかるメンテナンスが必要です。静的ファイルの最大の問題は、それらを検証またはテストして、欠落しているステップがないこと、または危機時に成功することさえ確認するのが非常に困難で時間がかかることです。
一方、Full Stack DR計画は、本番環境でFull Stack DRを使用して保守する、稼働中の動的なDRランブックです。つまり、DR計画は本番環境に対して検証およびテストでき、一度に数時間または数日間、すべての受託デッキを必要とする高額な停止は発生しません。
フェイルオーバー計画を使用して、リージョン全体およびそのリージョン内のすべての可用性ドメインを停止する致命的なイベントからの実際のディザスタ・リカバリを必要とする計画外の停止を処理します。これはディザスタ・リカバリの重要な機能であり、次のすべてのタスクおよびステップがスタンバイ・リージョンでのみ発生します:
- 永続ボリュームに使用されるブロックおよびファイル・ストレージをアクティブ化します。
- DR保護グループのメンバーであるAutonomous Databasesに対してData Guardフェイルオーバーを実行します。
- スタンバイOKEクラスタをスケール・アップします。
- バックアップからのリソースを使用して、スタンバイOKEクラスタのワークロードをリストアします。
- OKEリソースの永続ストレージ参照を更新します。
- OKEリソースのコンテナ・イメージ参照を更新します。
- OKEリソースのロード・バランサ参照を更新します。
- 更新されたリソースを使用してスタンバイ・クラスタをリストアします。これにより、すべてのリソースがコンテナ・イメージとともに起動され、永続ボリュームが想定どおりにマウントされます。
DRドリル計画を使用して、OCIインフラストラクチャとプラットフォームをスタンバイ・リージョンに導入する合成のモック・フェイルオーバーをテストしながら、本番システムに影響を与えずに稼働状態を維持します。DRドリルは、フェイルオーバーの一環として実行するのと同じステップを実行します。ただし、稼働中の本番システムへの影響を回避するために、クローン・データベースおよび永続ボリューム上で動作する点が異なります。
スイッチオーバー計画を使用して、政府の規制、ビジネス継続性監査、定期的なドリルを指定するサービス・レベル合意への準拠、またはアプリケーション・スタック全体を別のアベイラビリティ・ドメインおよびOCIリージョンに移行するための贅沢な環境があるその他の状況に対応するために、計画された停止を処理します。
次の図は、リージョン間のディザスタ・リカバリ用にデプロイされたOKEを示しています。ドリル、フェイルオーバーまたはスイッチオーバーの準備ができています。Full Stack DRは、スタンバイ・リージョンの既存のOKEクラスタにリソースおよびコンテナ・イメージをバックアップすることに注意してください。Autonomous Data GuardはOCI Oracle Autonomous Databaseサービスを使用して構成されますが、永続ボリュームのブロックおよびファイルのレプリケーションは、対応するOCIストレージ・サービスを使用して構成されます。
次の図は、フル・スタックDRが計画スイッチオーバーの調整を完了した後のOKEを示しています。2番目のリージョンのOKEクラスタですべてが実行され、ロード・バランサに関連付けられた指定されたバックエンド・セットが更新されました。
Full Stack DRは、各リージョンの保護グループのDRロールを自動的に変更し、ドリル、フェイルバックまたはスイッチバックのすべてをもう一方の方向に準備します。
OKE以上のリカバリのオーケストレーション
Kubernetesのフェイルオーバーを実行するだけでなく、レプリケートされた仮想マシンだけでなく、OCIインフラストラクチャとプラットフォーム・サービスのリカバリも調整しています。
既存のOKEクラスタを2つのOCIリージョンからFull Stack DRに追加するだけです。両方のリージョンにリソース・タイプを追加し、Full Stack DRにリージョン間の同期を維持するために必要なものとリカバリの動作方法を通知するいくつかのプロパティを指定します。次に、1つのボタンをクリックして完全なDR計画を生成し、次の例に示すように、OKEのリカバリに必要なすべてのステップと、同じアプリケーション・スタックの一部として含めたその他のすべてのステップを事前移入します。
OKEクラスタでホストされるリソースは、多くの場合、同時にリカバリする必要がある、より包括的なビジネス・システムまたはアプリケーション・スタックの一部にすぎません。OKEとともに、リカバリする必要がある、サポートされているインフラストラクチャおよびPlatform-as-a-Service (IaaSおよびPaaS)リソースを追加します。次に、上の図に示す計画のように見えるDR計画を数分で生成するボタンを1つ押します。
前述のDR計画の例には、OKEの組込みリカバリ・ステップに加え、同じビジネス・システムに必要ながOKEクラスタの外部にあるインフラストラクチャおよびプラットフォーム用のその他のリソースが含まれています。これには、他のアプリケーションやミドルウェアがインストールされているOCI Computeに必要なブロック・ボリューム、ファイル・システム、オブジェクト・ストレージ、OKEに関連しない他のロード・バランサ、および同じビジネス・システムの一部であるが、どちらのリージョンでもKubernetesクラスタの一部ではないデータベースなどが含まれます。
前述のDR計画の例には、OKEクラスタおよびOKEクラスタに含まれていない仮想マシン(VM)でOracleまたはOracle Applications以外を停止および起動するカスタム自動化によるユーザー定義ステップもあります。図に示すようなユーザー定義のステップは、すべての組込みステップを含む基本的なDR計画を作成した後に追加されます。ユーザー定義のステップでは、Full Stack DRにまだ組み込まれていないすべてのことを実行するようにDR計画を調整できます。
たとえば、ビジネス・システムには、社内アプリケーション、Oracle Analytics Cloud、OCI Integration、Oracle Business Intelligence Enterprise Editionなどの一般的なOCIサービス、その他の任意の数のサービス、およびOKEクラスタに含まれないOCI Marketplaceアプリケーションが含まれる場合があります。
準備状況をいつでも検証
いつでも(すべての)復旧の準備はできていますか?
ビジネス・システムをサポートするクラウド・インフラストラクチャは、時間の経過とともに進化します。ディザスタ・リカバリ計画は、データベース、コンピュート、ノード・プール、ストレージ、および様々なビジネス・システムをサポートするクラウド・インフラストラクチャに関するその他のすべての定期的な変更に足を踏み入れる必要があります。Full Stack DRは、いつでもデジタル障害に備えるためのツールを提供します。
Full Stack DRに組み込まれた非侵入の事前チェック機能を使用して、ドリル、フェイルオーバーおよびスイッチオーバーのDR計画の準備状況を定期的に検証します。事前チェックでは何も実行されず、リカバリ操作の成功を妨げる不整合を探してDR計画のすべてのステップをたどり、IT運用スタッフが問題を発生前に修正できるようにします。
Full Stack DRに追加したすべてのOKE、インフラストラクチャおよびデータベース・リソースの検証に役立つ定期的なリカバリ・ドリルを、本番システムへのダウンタイムなしでスタンバイ・リージョンで開始します。DRドリルは、モック・フェイルオーバーを実行し、スタンバイ・リージョンのOracle Databases、コンピュートおよびストレージのコピーとクローンを表示します。
オラクルの無停止の非侵入型DRドリルは、レプリケートされた仮想マシンを2番目のリージョンで単に起動するだけではありません。DRドリルは、コンピュート、ストレージ、データベース、OKE、ロード・バランサなど、Full Stack DR保護グループに属するすべてのOCIリソースを自動的に起動する合成モック・フェイルオーバーを事前形成します。
DRドリルの真の価値は、システム、データベース、アプリケーションのスペシャリストがお互いに何時間もタスクをやり取りしなくても、1つのボタンをクリックするだけで実行できることです。ITスタッフがインフラストラクチャを検証する時間を確保し、データベースがスタンバイ・リージョンで期待どおりに稼働していることを確認するために、すべてを数日間そのままにします。その後、DRドリルの停止計画を使用して、すべてを自動的に切り取り、すべてをクリーンアップします。
まとめ
Full Stack DRでは、すでにデプロイしたものを選択し、リカバリ中に同期を維持して管理する必要があるものを教えてもらうことで、OKEリソースをディザスタ・リカバリ計画に簡単に追加できます。あとは私たちがやります。
オラクルのゼロ・ダウンタイム、非侵入型事前チェックとDRドリルは、データベースやロード・バランサを含むインフラストラクチャ全体を行使し、スタンバイ・リージョンでレプリケートされた仮想マシンを起動するだけではありません。Full Stack DRは、ディザスタ・リカバリ保護の整合性が保たれていないことの検証に役立つツールを提供し、必要なときに自信を持って行使できます。
これはすべて、単純なVMフェイルオーバーを超えたOCIネイティブ・ディザスタ・リカバリ・サービスにつながり、IaaSおよびPaaSサービスを、単一のシームレスなワークフローにリカバリする必要がある他のほとんどすべてのサービスと統合します。
Full Stack DRを使用すると、少ない労力で、ディザスタ・リカバリ計画をより短時間で実現できます。
もっと知りたいですか?
OCI Full Stack Disaster Recoveryをまだ実際にご覧になっていない場合は、Oracle Cloud Infrastructureのアカウント・チームに今すぐデモンストレーションを設けてください。ドキュメント、価格、お客様成功事例、ビデオ、チュートリアル、ハンズオン・ラボなどの詳細は、Full Stack Disaster Recoveryをご覧ください。
既存のOracle Kubernetes EngineクラスタをFull Stack DRに追加して、完全に自動化されたエンドツーエンドのリカバリを行う方法については、次のリンクを参照してください。
