この記事はPhilippe FierensによるMore than Just Redundant Hardware: Exadata MAA and HA Explained part II, the Exadata Storage cellを日本語に翻訳したものです。
2024年10月30日
前回のエピソードでは、コンピュート・ノードに関して、Oracle Exadataが優れている点について説明しました。このブログでは、ExadataがExadata Storage Serverにもたらすものをご紹介します。
Exadata storage server(またはstorage cell)に、Oracle Databaseの実際のデータが格納されます。 また、 Smart Scanやオフロード機能、ハイブリッド列圧縮(HCC)のようなExadataのパフォーマンスとストレージの最適化において魔法が起こせるのもExadata Storage Serverです。.
ストレージ・サーバーにはHigh Capacity (HC), Extreme Flash (EF), and Extended Storage Server (XT)の3種類あります。.
これらのストレージ・サーバーは、CPU、RAMメモリー、RDMAメモリー、HCAなどのさまざまなコンポーネントで構成されています。
ストレージ・サーバーのモデル(XT、HC、EF)に応じて、大容量ハードディスク(XT)、または大容量ハードディスクとパフォーマンスが最適化されたフラッシュ・ドライブ(HC)、EFストレージサーバーの場合はパフォーマンスが最適化されたフラッシュ・ドライブと容量に最適化されたフラッシュ・ドライブを組み合わせて搭載しています。以下のアニメーションは、HCストレージ・サーバーとEFストレージ・サーバーの違いを示しています。

これら3種類のExadata Storage Serverとその使用例に関する詳細情報は、こちらのリンクからご覧いただけます。
ストレージ・サーバーのシステム・ドライブに何か問題が発生した場合、ユーザー・データに影響はありますか?
Exadata X7シリーズから、システム・ソフトウェアは個別のM.2ドライブに存在しています。ドライブはソフトウェアRAIDでミラーリングされており、何か問題が発生した場合はオンラインで交換可能です。
ユーザー・データとシステム・データは分離されていますが、Exadataは障害、エラー、ディスクの不良、破損、交換をどのように対応するのでしょうか? フラッシュやメモリーに存在するホット・データに対してはどのような保護がありますか?どのようなタイプの保護がありますか?
Exadata Monitoring Service (MS)は、ディスクのパフォーマンスと状態を継続的に監視します。パフォーマンスの低下は、多くの場合、ディスク障害の前兆です。
パフォーマンスの低いディスクは制限され、I/O は代替ミラーに送られます。
ストレージ・セルに搭載された予測障害機能は、誤検知を避けるためにドライブやフラッシュ・メモリの電源を自動的に切って入れなおします。
Exadataストレージ・セルは、ディスクのヘルス・チェックと診断を自動的に実行し、ディスクまたはフラッシュ・カードが正常と判断された場合、サービスに戻されて再同期されます。 逆に、正常ではないと判断された場合、ディスクまたはフラッシュ・ドライブは削除され、冗長性を維持するためにデータがリバランスされ、青色のサービスLEDが点灯します。 その後、ストレージ・サーバーの電源を切ることなく、オンラインでディスクまたはフラッシュ・ドライブを交換することができます。
ASMパートナーは、データベース・サーバーとストレージ・ノード間のI/O経路のネットワーク・パケットが破損した場合にも機能します。 ストレージ・セルは書き込みを防止し、ASMはパケットを再送して再試行します。
データベースの破損は、ASMミラーの1つから読み取り、正常なコピーを使用して破損を修正することで自動的に修復されます。
ここで詳しく説明しているように、定期的なExadataディスク・スクラビングがハードディスクに対して実行されます。
Exadataディスク・スクラビングによって、不良セクタを検出し、正常なASMミラー・コピーから読み取ることによって修復します。これが、ASMディスク・グループに HIGH REDUNDANCYを使用すること(これにより、プライマリ・エクステントと2つのミラーが提供されます)が非常に重要である理由の1つです。
スマートOLTPキャッシング機能により、ストレージの障害がアプリケーションに影響を与えず、一時停止がゼロではないにしても最小限に抑えられます。
これが実際にどのように機能するかは、次のアニメーションをご覧ください。

次のアニメーションは、障害が発生した場合に何が起こるかを示しています。

Exadataソフトウェアは、ストレージが交換されたストレージ・セルでフラッシュ・キャッシュが確実にウォームアップされるように状態要因も考慮します。理解を深めるために、以下のアニメーションをご覧ください。

自動ワークロード・レポジトリ・レポート(AWR)のExadataセクションには、事後の問題やReal Time Insightを使用したリアルタイムで、潜在的なパフォーマンスや健全性の問題を迅速に診断できるようにするための情報がたくさんあります。
すべて良し。データはディスクまたはフラッシュ・ドライブ上で安全ですが、ディスク・コントローラ自体はどうでしょうか?
Exadata X9Mおよびそれ以前のバージョンでは、コントローラ・キャッシュの障害から自動修復して破損を防ぐことができます。 X10Mでは、フラッシュ・キャッシュを活用することで、コントローラ・キャッシュの必要性をなくすためにさらなる最適化が行われました。
Exadataは非常に多くのCPU処理をセルにオフロードしていますが、それが多すぎるとどうなるでしょうか?システム全体が遅くなりますか?
このようなことが起こるとMSアラートがアラートを送信します。
リバース・オフロード機能は、ストレージ・セルのCPUが飽和した場合に、ストレージ・セルがオフロードした作業の一部をデータベース・ノードにプッシュバックすることができます。
この機能について詳しく知りたい場合は、次のリンクを参照してください。
セル全体で障害が発生したり、正しく機能しなくなったりした場合はどうなりますか?また、セルのソフトウェア・アップデート中にサービス・レベルを維持するにはどうすればよいでしょうか?
Exadata RS(Restart Server)プロセスは、ハングしたセルの再起動することができます。Instant Failure Detection(IFD)では、4つのRDMAパスを使用し、OSのタイムアウトに依存せずに、スプリット・ブレインの状況を防ぎます。
Exadata Flash Cacheの状態は、セル・ソフトウェアのローリング・アップデートやリバランス処理中も保持されます。 ストレージサーバーがシャットダウンされると、データベース・サーバー上のGrid Infrastructureのdiskmonプロセスに通知されるため、メンテナンスのためにストレージ層がシャットダウンされてもブラックアウトが発生しません。
結論:
このブログ記事で改めてご理解いただけるように、これらの機能はExadataがいかにユニークであるかを示す良い例です。ハードウェアとソフトウェアを一緒にエンジニアリングすることは、Oracle Exadataのスローガンだけでなく、現実のものとなっています。
More interesting links :
https://www.oracle.com/database/technologies/exadata/hardware/storageservers/
https://blogs.oracle.com/exadata/post/real-time-insight-quick-start
https://blogs.oracle.com/oracle4engineer/post/exadata-disk-scrubbing-jp
Exadata新機能
Other parts in this series :
冗長ハードウェアだけではない : Exadata MAA および HA の説明 – はじめに