この記事はAna Maria McCollumとChinmayi Pandaによる”Monitor SNMP-enabled Devices with collectd Integration in OCI Stack Monitoring“の日本語翻訳記事です。
OCI Stack Monitoringは、クラウドまたはオンプレミスで稼働するアプリケーションとその基盤となる技術スタックの統合的なヘルスモニタリングとアラーム管理を提供します。監視の盲点を回避するには、ネットワークデバイスを含む技術スタックのあらゆる部分を監視できることが重要です。OCI Stack MonitoringはcollectdおよびTelegrafと統合されており、幅広い種類のインフラストラクチャの監視を可能にします。このブログではcollectdのSNMPプラグインを活用して、ネットワークスイッチなどのSNMPデバイスを監視する方法をご紹介します。
ネットワークデバイスのSNMP監視
Simple Network Management Protocol(SNMP)は、ルーター、スイッチ、ファイアウォール、プリンターなどのネットワークデバイスの管理と監視において広く採用されている標準プロトコルです。SNMPを活用することで、組織はデバイスのパフォーマンス、稼働時間、その他の重要な指標に関する洞察を得ることができます。
collectdには、様々なインフラストラクチャタイプのメトリクスを収集する読み取りプラグインがあります。これには、 スイッチやルーターなどのSNMP対応デバイスからパフォーマンスメトリクスを収集できるSNMP読み取りプラグインが含まれます。collectdをOCI Stack Monitoringと統合することで、これらのネットワークデバイスやその他のSNMP対応デバイスの監視が可能になります。
SNMPデバイスの監視は簡単な4ステップのプロセスです
SNMPデバイスを監視するには、次の手順に従います。
ステップ1: 前提条件を完了
ステップ2: collectdからデータを受信できるように管理エージェントを構成
ステップ3: collectdのSNMPプラグインを構成
ステップ 4: 可用性ステータスの監視を構成 (オプションだが推奨)
ここで、これらの手順についてさらに詳しく説明します。
ステップ1 – 前提条件を完了する
ドキュメントに従って管理エージェントが適切なバージョンであり、collectdが構成されていることとポリシーが適用されていることを確認します。
ステップ2 – 管理エージェントを構成する
これは管理エージェントのメトリック レシーバーがwrite_httpプラグインを介して collectdからメトリック データを受信できるようにするための1回限りの手順です。
Stack Monitoringで、「リソース管理」メニューの「リソースのインポート」ページに移動し、「リソースのインポート」をクリックします。タイプ「CollectD」と管理エージェントを選択し、以下に示すようにプロセスを開始します。

有効化の一環として、エージェントディレクトリ ( <agent_state_directory>/extension_state/StackMonitoringMetricReceiver/certs/clientCerts/stackmonitoring-ca.crt ) に証明書が生成されます。
この証明書をcollectdがアクセスできるディレクトリにコピーしてください。collectd.confでwrite_httpプラグインがロードされていること、およびメトリックレシーバーのURLとこの証明書の場所がwrite_httpプラグインセクションに指定されていることを確認してください。これにより、collectdはエージェントでリッスンしているメトリックレシーバーにメトリックデータを送信できるようになります。
ステップ3 – collectdのSNMPプラグインを構成する
collectdには、様々なインフラストラクチャタイプのメトリックを収集するReadプラグインがあります。SNMPデバイスのパフォーマンスメトリックを収集するには、collectd.confファイルでSNMPプラグインをロードし指定されたデバイスからメトリック値を収集するように設定してください。設定例を以下に示します。
次に、「リソースのインポート」を再度実行して、SNMPデバイスをStack Monitoringの監視リソースとしてインポートします。
注:collectd.confで設定されたすべての読み取りプラグインは、スタック監視にインポートされます。すべてのプラグインに対してこの手順を実行する必要はありません。

ステップ4 – 可用性ステータス監視を構成する(オプションだが推奨)
デバイスに可用性ステータスのメトリックが含まれていない場合は、別のメトリックを可用性ステータス監視のプロキシとして使用できます。これを設定するには「リソース・タイプ構成」UIを使用して、可用性ステータスの判断に使用するメトリックを指定します。

次にリソースのインポートを再度実行し、この指定されたメトリックを使用してデバイスの可用性を判断します。

SNMPデバイスを簡単に監視
インポートプロセスが完了すると、Stack MonitoringでSNMP対応デバイスを監視できるようになります。デバイスの組み込みホームページにドリルダウンして、可用性ステータスとパフォーマンスを簡単に監視できます。任意のメトリックに対してMLベースの異常検出を有効にするとベースラインパフォーマンスの計算が開始され、パフォーマンスが想定範囲外の場合は異常値のフラグが付けられます。ホームページからトポロジページに移動し、そのデバイスに依存する他のリソース(ホストなど)との関連付けを作成することもできます。これらの関連リソースは、それぞれのトポロジビューからSNMPデバイスの健全性を自動的に把握できるようになります。

collectd(およびTelegraf)との統合により、Stack MonitoringはSNMPデバイスや様々な種類のインフラストラクチャ、アプリケーションを監視できます。これにより、アプリケーションスタックのパフォーマンスをエンドツーエンドでより詳細に可視化できます。