※ 本記事は、Satyendra Kuntalによる”Announcing enhanced alarms with custom messages and dashboard“を翻訳したものです。
2024年7月26日
Oracle Cloud Infrastructure (OCI) Monitoringは、アラーム定義およびアラーム視覚化機能の拡張機能を発表します。アラーム本文、サマリーおよび通知サブジェクトをカスタマイズして、必要な特定の情報を含めることができるようになり、アラームをトリガーしたコンテキストをより簡単かつ迅速に理解できるようになります。また、すべてのアラームの単一のビューが拡張され、すべてのアラームの集約された要約情報が得られ、迅速な意思決定が可能になります。
以前は、アラームの起動時に最初の応答者である管理者、ITOpsおよびDevOpsエンジニアは、アラーム・メッセージにアクション可能な命令を作成できませんでした。これは、ユーザーがアラーム本文に静的値のみを含めることができるためです。通知が送信される前に、リアルタイム・ディメンション値で置換できる動的変数を追加できませんでした。
さらに、アラームの件名やサマリーを取得したフィールドはありません。アラーム・サマリーは、次の形式で静的でした: アラーム <Dimension key> は <alarm status> 状態です。次に示すディメンションを持つリソースは、トリガー・ルール<query>を満たしており、トリガー遅延は<Trigger delay minutes>です。アラームの件名には、<Type> | <Severity> |<Name of the alarm>|Timestampという静的形式もありました。たとえば、”OK_TO_FIRING | Critical | CPU Utilization Alert|2023-10-26T13:48:00Z”です。
さらに、影響を受けるリソース(またはディメンション)などの重要な情報は、エンジニアが通知をスクロールして影響を受けるメトリック・ストリームを探さないかぎり、簡単に表示できませんでした。その結果、応答が遅延したり、通知メッセージの動作に関する技術的な知識を持つエンジニアが必要になりました。
通知の必要性は、より人間が理解しやすく、直感的で実用的なものであることがわかりました。そのため、アラームを定義しながら、影響を受けるリソースやメトリック値などの値を含むアラーム本文、サマリーおよび件名を構成できるようになりました。これらの拡張機能により、アラームがトリガーされたときに、アラーム本文、サマリーおよび通知サブジェクトのメトリックのリアルタイム値を表示するだけでなく、アラームの全体的なリストのコンテキストを簡単に理解できるようになります。
アラーム本文、サマリーおよび通知サブジェクトのカスタマイズ
アラーム本文、件名、概要を含む独自のアラーム・メッセージを作成する機能を提供しています。メトリック名、リソース名、アラームをトリガーしたメトリック値、アラーム条件などのコンテキスト固有の情報を含めることができるようになりました。これらの変数の値は、アラーム・コンテンツに動的に移入されるため、特定のアラームがトリガーされるメトリックまたは重大度がわかるように、意味のある実用的なメッセージを伝達しやすくなります。
この機能改善の一環として、アラーム定義フローに2つの新しい情報取得フィールド(通知件名およびアラーム・サマリー)を追加します。また、アラーム通知JSONの一部である変数を、既存のアラーム本文フィールドおよび新しいフィールドに追加する機能も提供しています。
アラームの内容をカスタマイズするには、フォーム {{variable}}の変数のリストを使用できます。ドキュメントが通知とともに送信されると、文字列 {{variable}} は、対応するアラーム通知ペイロードから引き出された実際の値に置き換えられます。たとえば、アラーム本文が {{timestamp}} の {{metricValues}} によりしきい値が違反したためにトリガーされた “{{severity}} アラームとして入力された場合、2023-08-15T19:51:00の [CpuUtilization[1m].mean():92] によりしきい値が違反したためにトリガーされたCRITICALアラームとしてレンダリングされます。変数は、電子メール、Slack、関数など、すべての通知チャネルでサポートされています。
注目の詳細
この更新には、次の機能もあります:
グループ通知オプション: 1つのグループ通知を送信するオプションがすべての起動メトリック・ストリームに対して有効になっている場合、最初のディメンションのみを追加できます。分割通知の場合、通知ごとに許可されるメトリック・ストリームは1つのみであるため、1つの変数のサポートは問題ありません。
文字制限: アラーム本文の文字制限は1,000文字です。サマリーは、ユーザーによるクイック・レビュー用に500文字に制限されていますが、アラーム通知の件名は160文字に制限されています。件名には100文字以上かかるため、OCIDsはサポートされません。
メトリック値: すべての副問合せの最初のメトリック値のみを返します。たとえば、問合せが CPUutilization.mean > 75 || Memoryutilization.mean() > 48 の場合です。CpuUtilizationが76で、MemoryUtilizationが38の場合、[76, 38] を返します。

アラーム・ステータス・ダッシュボード
コンテキストがない起動アラームのリストを表示することの苦痛を理解し、コンテキストやその他の詳細を理解するために個々のアラームに移動する必要があります。アラーム・ステータス・ダッシュボードに包括的なビューが提供され、要約された情報をすばやく統合できるようになりました。「Alarm Status」ビューには、簡単なアラームサマリー、アラームをトリガーしたリソースタイプ、およびサマリービューからアクション可能な決定を行うためのわかりやすい簡潔な情報を取得できるように、関連するその他の詳細が充実しています。これは、発射されるすべてのアラーム用の単一の画面です。
アラーム・ステータス・ダッシュボードでは、サービス間アラームがリストされたアラーム・トリアージ・ビューが作成されます。アラームの重大度およびアラームの詳細(アラーム名、アラームの件名およびサマリー、アラームの影響を受けるメトリック・ストリームの数、重大度など)別に要約されたアラーム数が表示されます。アラーム・ダッシュボードの列をカスタマイズできるようになりました。このダッシュボードでは、リストに表示する列を選択できます。また、メトリック・ネームスペース、アラームの重大度、リソース・グループ、アラームがトリガーされた相対時間ウィンドウ(過去1時間など)などの基準に基づいてアラームをフィルタすることもできます。

始めましょう
アラーム・メッセージ・コンテンツをカスタマイズし、アラームの概要リストを表示する拡張機能は、すべての商用リージョンで使用できます。これらの機能は、これまで利用可能だった静的コンテンツを含む既存のアラーム定義に変更を加えるものではありません。詳細は、テクニカル・ドキュメントを参照してください。
Oracle Cloud無料トライアルにサインアップするか、アカウントにサインインして、インフラを監視するためのOracle Cloud Infrastructure Monitoringをご体験ください。ご連絡をお待ちしております。ご不明な点やご意見がございましたら、お問い合わせください。
