※ 本記事は、Elói Lopesによる”Monitoring and Observability Best Practices for OCI GoldenGate Deployments“を翻訳したものです。
2026年1月20日
はじめに
Oracle Cloud Infrastructure (OCI) GoldenGateデプロイメントの最適なパフォーマンスと信頼性を確保するには、監視と可観測性が重要です。このブログでは、様々なOCIツールおよび機能を活用してGoldenGate環境を効果的に監視および管理するためのベスト・プラクティスについて概説します。
1. OCI GoldenGateデプロイメント・コンソールの使用
OCI GoldenGateデプロイメント・コンソールは、レプリケーション・プロセスの状態とパフォーマンスをリアルタイムで可視化します。
GoldenGateパフォーマンス・メトリック・サービスでは、次のことができます:
- プロセス・ステータスのモニター: Extract、Replicatおよび関連プロセスの状態を追跡します。
- パフォーマンス・メトリックの分析: ラグ時間、スループットおよびエラー率を確認します。
- メッセージおよびステータス変更のレビュー: ログを調べて問題を迅速に特定し、トラブルシューティングします。
これらのメトリックを定期的に確認することで、GoldenGate環境の運用状態とパフォーマンスを維持できます。
詳細はこちら: https://docs.oracle.com/iaas/goldengate/doc/troubleshoot-using-deployment-console.html

2. ラグを監視するためのハートビート表の実装
ハートビート表は、データベース間のデータ・レプリケーションの適時性の追跡に役立ちます。ソースからターゲット・データベースに定期的なシグナルを送信し、タイムスタンプを記録することで、組織はレプリケーション・プロセスの遅延を簡単に監視および測定できます。これにより、レプリケーションの問題を迅速に検出して解決できます。
ハートビート表を構成すると、次のようになります:
- ラグ検出: ソース・データベースとターゲット・データベースの時間差を測定します。
- トラブルシューティング: レイテンシの問題を迅速に特定して対処します。
このアプローチにより、データの一貫性とタイムリーなレプリケーションが保証されます。
3. OCI Monitoringとアラームの活用
OCI Monitoringは、OCI GoldenGateおよび関連リソースのメトリックとアラートを提供します。次の方法で運用意識を維持できます:
- メトリック: CPU使用率、メモリー使用率、抽出およびレプリケーション・ラグを確認します。
- アラームと通知: アラートをトリガーする条件を定義します。 (例: 60秒以上)
- イベント・サブスクリプション: プロセスの再起動や失敗など、特定のシステム・イベントが発生したときに通知されます。
アラームをOCI Notificationsと統合して、電子メール、PagerDuty、SlackまたはServiceNowへの自動メッセージを有効にできます。
詳細はこちら: https://docs.oracle.com/iaas/Content/Monitoring/Concepts/monitoringoverview.htm
https://blogs.oracle.com/dataintegration/post/using-oci-monitoring-and-application-performance-monitoring-for-oci-goldengate-troubleshooting
4. Oracle Enterprise Manager (OEM) Plugin for GoldenGateとの統合
Oracle Enterprise Manager(OEM)は、複数のGoldenGateデプロイメントを監視および管理するための一元化されたプラットフォームであり、OCI GoldenGateなどのオンプレミスまたはマネージド・サービスにインストールできます。OEM GoldenGateプラグインを使用すると、次のことができます:
- パフォーマンスの監視: 複数のターゲットにわたる主要なレプリケーションインジケータを追跡します。
- アラートを受信: クリティカルなしきい値またはイベントの通知を構成します。
- トレンドの分析: 過去のパフォーマンス・データを活用して長期的なパターンを特定し、構成を最適化します。
この統合によって可視性が高まり、管理者は1つのコンソールから複数のレプリケーション・システムを管理できます。
5. OCI Loggingを使用した可視性の向上
OCI Loggingにより、OCI GoldenGateデプロイメントからのログへの集中アクセスが可能になり、次のことが可能になります:
- ログの集計: 包括的な分析のために、様々なソースからログを収集します。
- 検索と分析: 検索機能を使用して、問題と傾向を特定します。
- アラートの設定: 特定のログ・パターンまたはイベントに基づいてアラートを構成します。
OCI GoldenGateのOCIロギングを有効にするには、このリンクをチェックします。
OCI Logging Analyticsの統合により、さらに深いインサイトが得られ、高度なクエリと異常検出が可能になります。
詳細はこちら: https://docs.oracle.com/iaas/goldengate/doc/troubleshoot-using-logs.html
6. 包括的な可観測性のためのスタック・モニタリングの実装
OCIのスタック・モニタリングにより、GoldenGateコンポーネントを含むアプリケーションとその基礎となるスタックをプロアクティブに監視できます。Stack Monitoringを使用すると、次のことができます:
- リソースの検出: GoldenGateコンポーネントを自動的に検出および監視します。
- メトリックのモニター: パフォーマンスおよびヘルスに関連するメトリックを収集および分析します。
- トポロジのビジュアル化: スタック内の様々なコンポーネント間の関係を理解します。
この統合ビューは、アプリケーション・スタック全体の問題を特定して解決するのに役立ちます。
詳細はこちら: https://docs.oracle.com/iaas/stack-monitoring/doc/introduction.html
7. ワークフローのトラブルシューティングの例
レプリケーション・ラグまたは障害が発生した場合:
- デプロイメント・コンソールの確認 → プロセスの正常性とエラーを識別します。
- ハートビート表のレビュー → 実際のレプリケーション遅延を確認します。
- AWRレポート → Oracle Databasesの場合は、AWRレポートを確認します。
- OCIログの検査 → ExtractまたはReplicatのログでエラーを見つけます。
- OCI Monitoringのメトリックの分析 → システム・レベルのリソースのボトルネックを特定します。
適切な監視ツールの選択
| 要件 | 推奨OCIツール |
| GoldenGateプロセスのリアルタイム監視 | GoldenGateデプロイメント・コンソール |
| レプリケーション・ラグの検出 | ハートビート表 |
| アラートとメトリック分析 | OCI監視とアラーム |
| 一元的なログ管理 | OCI Logging / Logging Analytics |
| 複数の環境にわたる一元的な可視性 | Oracle Enterprise Manager (OEM) |
まとめ
これらのOCIツールを統合することで、統一されたプロアクティブな可観測性フレームワークを確立できます。定期的な監視と自動アラートにより、OCI GoldenGate環境全体で高可用性とレプリケーションの効率性が確保されます。
