※ 本記事は、Amit Seth, Sandeep Manohar Nirikhiによる”Take control of your networks with the OCI network monitoring kit“を翻訳したものです。
2023年9月12日
一般的な企業では、ワークロードが複数の施設、クラウド・プロバイダおよび地理に分散しています。しかし、これらのシステムは複雑であるため、ユーザーはどこにいても、アプリケーションへのスムーズなアクセスを期待します。ニーズを満たすには、柔軟性に優れ、パフォーマンスに優れ、安全で管理しやすいネットワークが必要です。Oracle Cloud Infrastructure(OCI)を使用している場合は、オラクルがサポートします。OCIは、統合された監視と可観測性を備えたクラス最高のクラウド・ネットワーキング機能を提供します。
OCIネットワーク監視ツールキットを使用すると、仮想ネットワークを簡単に表示、測定および診断して、接続要件を日常的に管理できます。このブログ記事は、その方法を教えています。
仮想ネットワークを見る
まず、ネットワークを表示およびビジュアル化できる必要があります。久しぶりにネットワーク・デザインを書き留めたかもしれませんが、最新の状態に保っていましたか? おそらくそうではありません。

Network Visualizerを使用すると、いつでもネットワーク・トポロジ全体をビジュアル化できます。オンプレミスからOCI仮想クラウド・ネットワーク(VCN)に至るまで、ネットワーク・リソースとそれらに接続するリンクを表示できます。トポロジ上の任意のリソースを選択し、ルーティング、セキュリティおよびステータスの詳細を確認できます。
健全性とパフォーマンスの測定
次に、ネットワークの状態とパフォーマンスを測定して、接続性の期待を満たしていることを確認し、問題に対処する必要があります。

ネットワーク・リソースのヘルスとパフォーマンスを測定するには、OCIネットワーク・メトリックを使用できます。OCIは、動的ルーティング・ゲートウェイ(DRG)、FastConnect、インターネット・ゲートウェイ、ネットワーク・アドレス変換(NAT)ゲートウェイ、サービス・ゲートウェイ、サイト間VPN、仮想ネットワーク・インタフェース・カード(VNIC)など、広範囲のネットワーク・リソースのメトリックをサポートしています。
一定期間にわたるネットワーク・パフォーマンスを確認するには、Oracle Cloudコンソールのメトリック・エクスプローラを使用します。このエクスプローラでは、メトリックの履歴トレンドを確認できます。
問題の診断
最後に、問題を診断する機能が必要です。何か間違っていることがわかったら、根本原因を見つける必要があります。これは、ダウン・リンク、セキュリティ・ルールの構成ミス、予期しないトラフィックの洪水など、単純なものです。場合によっては、トラフィック・パケット(ワイヤタップに相当するネットワーク)を確認する必要があります。

診断を容易にするために、OCIには次の機能があります。:
-
Network Path Analyzerを使用すると、特定のソースから宛先へのルーティングおよびセキュリティ・ポリシーのホップバイホップ分析を実行できます。
-
VCNフロー・ログを使用すると、レポートおよびトラブルシューティングの目的でネットワーク・パフォーマンスを診断できます。OCI VCNに入り出るすべてのトラフィックをログに記録し、特定のリソースとの間のトラフィックをログに記録できます。
-
高度なトラブルシューティングの場合、仮想テスト・アクセス・ポイント(VTAP)にアクセスして、指定したソースから特定のターゲットへのトラフィックをミラー化できます。
これは、オラクルがお話ししているOCIネイティブのネットワーク監視機能として非常に役立ちます。それらすべてを説明する例を挙げましょう。
実施事例のモニタリング
6つの大陸にオフィスがあるInnovative Stuff and Things (IST), Incのネットワーク管理者の立場になってみましょう。最近、一部のアプリケーションをOCIに移行しましたが、まだデータ・センターがあります(現時点)。複雑な環境です。オフィスにたどり着き、電話機はすでにネットワークの問題を示しています。注文アプリケーションには誰も到達できません。さらにいくつかの問題が稼働していますが、これは即時の優先度です。
開発チームは大忙しです。送信した図はすべて古くなっている可能性があります。そのため、Oracle CloudコンソールからNetwork Visualizerをプルアップして、ネットワークのレイアウトを確認します。Network Visualizerを使用すると、トポロジ内の任意のリソースを表示したり、ルーティング設定を確認したり、セキュリティ構成の詳細を確認できます。

すぐに、順序付けアプリケーションが他のすべてのユーザーから切断されたサブネットにあることがわかります。これは容易な修正です。
次に、メッセージを確認します。オーストラリアのチームは顧客アプリケーションにアクセスできません。Network Visualizerから、カスタマ・アプリケーションが接続されたサブネットに存在し、この問題について他の誰も言及していないことがわかります。そのため、オーストラリアのチームに固有の到達性の問題である可能性があります。
コンソールでNetwork Path Analyzerを起動します。Path Analyzerを使用すると、2つのポイント間の到達可能性を診断できます。オーストラリアのオフィスと顧客アプリケーションをエンドポイントとして選択します。

案の定、ここからは行けません。ルーティングおよびセキュリティ・ポリシーがありません。サイド・ノートとして、ロンドンとディザスタ・リカバリ・サイト間のネットワーク・パフォーマンスとレイテンシの考慮事項を考慮して、ヨーロッパ内から選ぶ適切なディザスタ・リカバリ・サイトの一部をショートリストに記載するよう、ロンドンのオフィスからも要請されています。リージョン間のレイテンシ・ダッシュボードを使用すると、2つのOCIリージョン間のリアルタイムおよび履歴レイテンシのトレンドを確認できます。ロンドンとヨーロッパ内の他の地域間のリージョン間のレイテンシ間トレンドに基づいて、アムステルダムとパリをロンドン・オフィスへのディザスタ・リカバリ・サイト候補として推奨します。


プレート上の問題はこれまでに解消しましたが、運用チームが新しい興味深い問題をあなたに提供します。シンガポールのシステム更新は失敗しています。更新プロセスが単独で再試行し続けるため、これまでのところ優先度の高い問題ではありませんでしたが、現在1週間は失敗し、注意が必要です。これらの更新は、毎晩遅くにキックインするようにスケジュールされています。そのため、シンガポール・ネットワークのフロー・ログを設定して、夜間に何が起こっているかをレビューし、その日の間オフィスを離れます。

次の朝、フロー・ログ・ダッシュボードを確認して、更新トラフィックのみが拒否され、残りのネットワーク・トラフィックは正常終了していることを確認します。ネットワーク構成を少し深く見て、更新トラフィックに影響するセキュリティー・ポリシーに誤りがあることがわかります。再び、問題を特定したので、簡単に修正できます。
まとめ
高度なトラブルシューティングの場合は、VTAPを使用して、ネットワーク・インタフェースなどの特定のポイントのネットワーク・トラフィックを調査することもできます。VTAPは、より深い検査と分析のために、ネットワーク・リソースからのトラフィックをミラー化するのに役立ちます。WireSharkなどのパケット・アナライザ・ツールに精通している場合は、VTAPトラフィックがこのツールにフィードできます。
プロアクティブなネットワーク・ヘルスおよびパフォーマンス監視のために、ネットワーク環境内のリソース全体(ネットワーク・インタフェース、ロード・バランサ、DRG、FastConnect、VPNなど)で対象となるメトリックのアラートしきい値を設定できます。メトリックにパフォーマンスの低下の兆候が示された場合は常に通知を受信できるため、エンド・ユーザーに影響を与える前に潜在的な問題を事前に処理できます。
オラクルのネットワーク監視ツールキットは、クラウド・ネットワーク・インフラストラクチャの計画、確認、測定、診断に必要なすべてを提供し、ユーザーとアプリケーションの複雑なハイブリッド・マルチクラウド接続ニーズを満たすのに役立ちます。この理由と様々な理由で、お客様はOracle Cloud Infrastructureを選択しています。
