※ 本記事は、Gareth Chapmanによる”Maximizing Application Resilience, Performance, and Security with AHF – 2024 Feature Recap“を翻訳したものです。

2024年12月13日


Oracle Autonomous Health Framework (AHF) は毎月新機能とともにリリースされるため、2024年末までには、今年中にすべての新機能の概要を共有したいと考えていました。

AHFは、最先端のAIを使用してアプリケーションの回復力、パフォーマンス、およびセキュリティを最大化し、問題を防止および解決できるようにします。

これは、既存のソフトウェア・サポート契約の一部として追加コストなしで利用できます。

 

2024年にAHFで提供された新機能の要約を次に示します

AHFチームは、DBAおよびフリート管理者による次の支援に重点を置いています:

 

DBAエクスペリエンス

AHFを使用する前は, 次のような典型的なDBAエクスペリエンスがありました: 

Experience Before AHF

 

AHFを使用した今の体験は以下の通りです。:

Experience with AHF

 

AHFはどこにでもデプロイされ、簡単にアップグレードできます。

AHF deployed everywhere

 

 

問題の解決

AHFには、Exadata用のExac HKおよび他のシステム用のOrachkが含まれています。AHFのヘルスチェックはお客様から好評です。

“情報を手動で取得する時間と労力を節約できます”

 

“重要な問題を常に把握し、停止する前に知ることができます”

 

2024年にAHFは毎月、新しいベストプラクティスのヘルス・チェックをリリースしています。これにより、DBAは、問題が発生する前に予防的に問題を防ぐことができます。AHFは、次のレベルに基づいてこれらのヘルス・チェックをセグメント化します。:

  • Critical – 重大な影響 – できるだけ早く修正する必要があります
  • Failure – 可用性、整合性またはディザスタ・リカバリのリスク – 四半期内に修正する必要があります
  • Warning – システムを改善する可能性はありますが、可用性、整合性、または障害回復のリスクは発生しません – 可能な場合は修正してください
  • Info – 有益なプロアクティブな更新または情報 – 該当する場合は修正

ヘルス・チェック・カタログを介して、すべてのチェックの詳細を確認できます :

 

セキュリティに関するヘルスチェック

OrachkとExachkのレポートでは、新しいセキュリティ・セクションが追加され、すべてのベスト・プラクティスのセキュリティ関連チェックがグループ化されています。

AHF Security compliance checks

 

さらに、 Database Security Assessment (DBSAT) がバージョン3.1にアップグレードされました

orachk-dbsat-new

Oracle Database Security Assessment Tool(DBSAT)は、特定されたセキュリティ・リスクやOracle Databases内のギャップを軽減する方法に関する優先的な推奨事項を提供します。DBSATは、構成、機密データの検出など、現在の状態を評価することで、データベースのセキュリティおよびコンプライアンス状態をプロファイルします。

セキュリティ推奨事項を含むAHFベスト・プラクティス・レポートを生成するには、次を実行します:

ahfctl compliance -profile security

セキュリティの推奨事項とシステム実行の完全な状態を含むAHFベスト・プラクティス・レポートを生成するには、次を実行します:

ahfctl compliance -includeprofile security

 

プラチナの監視とパッチ適用

Platinum serviceは、AHFのExadataの構成データに基づき、Exadataのお客様に対して障害関しとパッチ適用を提供します。

AHFは、Exadata dom0、ストレージ・サーバーおよびスイッチに次の機能を追加しました。:

  • 自動アップグレード
  • 自動ベストプラクティス・チェック
  • 自動診断収集
  • SRへの診断収集の自動アップロード

これにより、Platinum障害検出およびパッチ適用サービスがコンポーネントの関係を使用できるようになります。dom0から障害を検出すると、影響を受けるデータベース・ノードを特定できます。仮想化されたラックのパッチ計画は、コンポーネントの関係を理解し、ダウンタイムを短縮します。

 

フリート・レベルでのヘルス・チェックのベスト・プラクティス

AHFフリート・インサイト を使用すると、サイズに関係なく、データベース・フリート全体でベスト・プラクティスを簡単に適用できます。

まず、独自のデータベースを持つ別のサーバーにAHFフリート・インサイトをインストールします。次に、各クラスタにAHFを1回登録して、診断データ収集を有効にします。

AHF Fleet Insights Setup

 

AHFフリート・インサイトは、データベース・フリート全体の包括的なビューを提供し、クリティカル・チェックの失敗を迅速に識別できるようにします。まず、通常または過半数の動作からの逸脱を分析し、根本原因と推奨される解決策を調査します。

health check from fleet

 

これを繰り返すことで、徐々にリスクを減らし、フリート全体のの回復力を向上させます。

 

データベースのフリートに関するヘルス・チェックを確認する方法については、この短いデモ・ビデオをご覧ください

 

 


 

問題解決

AHFを使用すると、根本原因の解決に必要なすべてのものを使用して、問題固有の診断収集を簡単に生成できます。

お客様の声:

“稼働中のシステム/DBに関する正確なインサイトを取得し、過去に何が起こったかを確認して、根本原因を特定できます”

 

“データ取得を簡素化”

コレクションは、単純な単一コマンドで生成できます:

diagcollect

 

しかし、自律的な健康フレームワークを運営する最善の方法は……自律的であることです。

デフォルトでは、AHFは問題を監視し、関連する診断データを自動的に取得します。

次のコマンドを使用して1回度設定すると、問題が検出されるたびに電子メール通知が送信されます。各電子メールには、自動診断収集の場所に関する詳細が含まれます。

ahf configuration set --type smtp --all 

 

insights in every collection

 

すべての診断コレクションにAHF Insightsが含まれるようになりました (コレクション内の*insights*.zipにあります)。

AHF Insightsは、包括的なシステム概要を提供し、お客様がデータベースの問題を個別に解決できるようにします。

 

解決策を含む1ページの問題概要

AHFインサイトに「検出された問題(Detected Problem)」パネルが追加され、これにドリルダウンすると、検出された問題の1ページのサマリーが表示されます。各問題サマリーでは、何が起こったのか、その理由を、証拠とともに説明し、解決手順を簡単に行うことができます。

detected problem panel

エビデンスを展開して、原因を確認するチャートまたはログ詳細を表示します。.

 

AHF will now automatically detect and provide a single page problem summary for Node evictionsinstance evictions and database slow performance caused by:

AHFは、ノード排除、インスタンス排除、および次の原因によるデータベースの低速パフォーマンスに関する単一ページの問題サマリーを自動的に検出して提供します。

不十分な構成

  • Jumbo frames
  • UDP buffers
  • IP reassembly buffer
  • HugePages
  • NIC buffer size
  • Insufficient DBWR processes
  • Message buffers in the network interfaces too small
  • DB Writer
  • PGA limit

リソース・ボトルネック:

  • High CPU Steal
  • NIC unavailable
  • Critical background processes stuck in D state
  • Increasing memory usage of GI processes
  • Increasing memory usage of DB processes
  • Increasing memory usage of non-db processes
  • Increasing memory by new databases
  • DB Recovery Read IO
  • Latch contention
  • Archiver blocked

リソース・エラー:

  • IP reassembly failures
  • Multipath Disk Failures
  • IO errors due to insufficient storage space
  • Generic IO errors

 

タイムライン 

問題がAHFの既知のシグネチャのうちの1つでない場合でも、AHFインサイトによってすべての診断が表示され、その識別に役立ちます。まずはTimelineパネルです。

insights-timeline-panel

Timelineは、重要なイベント、その発生場所および順序を示すクイック・ビジュアルを提供します。これは、症状をトレースして根本原因のイベントを特定するのに役立ちます。

insights timeline

追加のタイムライン・ビューが追加され、ホスト、データベースまたはコンポーネントごとにイベントを表示できます。これにより、問題がデータベース・スタックの特定のコンポーネントにどのように影響するかを把握できるため、問題がどこにあるかをより迅速かつ簡単に特定できます。

イベントの上にカーソルを置くと、イベントの詳細情報が表示され、イベントをクリックしてから、インサイト・ログ・ファイル・ビューアに関連するログ・エントリが開きます。

 

Operating System 問題

問題の原因を特定するための次のパネルは、Operating System Issueです

Insights-os-issues-panel

これは、OS構成、多数のメトリックをチャート形式で示し、問題のあるメトリック、およびすべてのOSの問題のサマリーレポートを示します。

Insights OS Metrics

 

Database Anomalies Advisor

Database Anomalies Advisorパネルは、AIで検出された異常なデータベースイベントの結果を表示します。

insights-database-anomalies-panel

これをドリルすると、データベースで検出されたすべての異常AHFが、問題の説明、原因の説明および推奨アクションとともに表示されます。

Insights Database Anomalies

 

Space usage

新しいSpace usage(領域使用状況)パネルでは、ディスク領域が使用されている場所が強調表示されます。

Insights Space Usage Panel

Disk Utilizationは、すべてのディスク領域使用量を一目で確認できます:

Insights space usage 1

次に、Diagnostics Space Usage セクションでは、すべてのデータベースおよびGrid Infrastructureの診断先ディレクトリが分類されるため、任意の異常を簡単に識別できます

insights space usage

 

AHFを使用したパフォーマンス・チューニング

データベース・パフォーマンスのチューニングに役立つように、インサイトにAWRレポートとPerfHubレポートの両方を含む「パフォーマンス・レポート」セクションが含まれるようになりました。

Insights database performance section

 

オーバー・サブスクリプション関連の低速なパフォーマンスの場合、DBA、クラスタ管理者およびフリート管理者はAHFインサイトに加えてAHFバランスを利用できます。For over-subscription-related slow performance, DBAs, Cluster Admins, and Fleet Admins can leverage AHF Balance in addition to AHF Insights.

AHF Balanceは、AIを使用して最適なデータベースCPU_COUNT値を推奨し、ハードウェア・リソース使用率を最大化しながらパフォーマンスを向上させます。

新しい–limit-db-changesオプションは、CPU_COUNTの推奨事項の影響を受けるデータベースの数を制限し、徐々にチューニングを調整できるようにします。

例:

フリート・パフォーマンス・チューニングの推奨事項の取得方法:

ahf analysis create --type impact --scope fleet --name <fleet-name> --limit-db-changes <num_dbs>

フリート・レポートにより、クラスタ当たりの推奨されるデータベース変更の数が制限されます。

クラスタ・パフォーマンス・チューニングの推奨事項の取得方法:

ahf analysis create --type impact --scope cluster --name <fleet-name> --limit-db-changes <num_dbs>

 

Oracleデータベースのパフォーマンス・チューニングにAHFを使用する方法の詳細は、こちらのビデオをご参照ください:

 

フリート・レベルからの問題の解決

AHF Fleet Insights を使用すると、データベース・フリート管理者は、問題を一元的に表示および分析し、バリエーションを特定およびグループ化できます。

AHFフリート・インサイトは、AHFからのすべての診断コレクションを組み合せたもので、タイムラインや問題要約などの詳細なインサイトに解決の詳細を簡単にドリルできます。データベース・スタックで発生するイベントについて、フリート全体にわたって理解できます。

Exadataやクラスタなどのトポロジ、またはソフトウェアのバージョンやハードウェア・モデルなどの構成で探索します。データベースの問題がホーム・ダッシュボードに表示され、インサイトで検出された問題パネルにドリルダウンできます。ここから、その根本原因がどのように特定されたかを理解するためのすべての証拠とともに、問題、原因および解決を可視化します。

例: AHF Fleet Insightsによる問題の根本原因の特定

 

 


 

構成およびデータベース・イベントの理解

多くのDBAが、次を実行するようにcronジョブを構成することで、AHFインサイトを定期的に実行するようになりました:

ahf analysis create --type insights

このAHFインサイトをサポートするために、単一インスタンス・システムとより長い時間範囲の両方のサポートが追加されました。–lastオプションを追加して頻度を指定できます。

例:

analysis create --type insights --last 12h

 

インサイトには、構成関連のパネルが幅広く選択されており、前述の「Space Analysis」パネルである「Data Guard」パネルは今年新しくなりました。.

Insights configuration panels

 

フリート全体のリアルタイム構成分析

インサイト自体が不十分な場合は、AHFフリート・インサイトによって大規模な構成分析が可能になります。これにより、フリート全体の構成の相違を簡単に識別して解決できます。構成の更新はリアルタイムで処理されるため、フリートの構成の最新ビューが常に表示されます。

ハードウェア、OSおよびデータベースのバージョニングと構成の類似点および全フリート間の相違点を確認する方法については、次のビデオ例を参照してください。

 

 

問題の履歴トレンドの分析

AHFフリート・インサイトは、リアルタイム監視を超えており、フリート管理者は過去の傾向を分析し、改善すべき領域を特定し、パフォーマンスを最適化し、将来の容量を計画し、コストを効果的に管理できます。

履歴データは長期間保存されるため、貴重な診断情報が失われるのを防ぎます。

例: AHFフリート・インサイトを使用した過去のデータベース・トレンドの分析

 

 

2025も引き続きAutonomous Health Frameworkが進化し続けることを楽しみにしています。

 

Autonomous Health Framework を今すぐはじめましょう

Oracle Autonomous Health Frameworkをダウンロード.

 

AHF フリート・インサイトを今すぐ始めましょう