※ 本記事は、Dhvani Shethによる”Cloud performance benchmark of CRUNCH CFD Solver“を翻訳したものです。

2022年8月10日


CRUNCH CFDに関する以前のブログでは、Elastic Fabric Adapter(EFA)およびOracle Cloud Infrastructure(OCI)BM.Optimized3.36シェイプの有無にかかわらず、AWS c5n.18の大規模なインスタンスにおける燃焼研究非構造化Navier-Stokes Solverのパフォーマンスを比較しました。Oracleの高性能コンピューティング(HPC)クラスタは、AWSよりも高いパフォーマンス上の優位性を示しており、1回の反復で15%の時間を短縮できました。

このブログでは、Amazon Web Services(AWS)のhpc6a.48xlargeインスタンスをOCIのBM.Optimized3.36と比較しました。OracleはCRAFT Techと連携し、CRAFT Techが開発した商業コードであるCRUNCH CFD v3.4ソルバーの一連のベンチマークを実施しました。マルチ物理フレームワークは、すべての速度フローに適用可能な、一般的な事前調整済みフローソルバーを使用します。

A graphic depicting the pump used in the benchmark test.

Figure 1: Case of Q/QD = 1.0/sup>

ベンチマーク設定

OCIリソース・マネージャのスタックを使用して、ベア・メタルHPC(BM.Optimized3.36)インスタンスのクラスタを作成します。このスタックは、インスタンスのコレクションを機能的なHPCクラスタに変換するすべてのパートを含むTerraformテンプレートを使用します。スタックでは、ネットワーク・ファイル共有(NFS)共有ボリューム、追加のブロック・ボリューム、またはOCI File StorageサービスやSLURMスケジューラなどの別のファイル・システムを追加できます。

ベンチマーク・テスト・ケースは、単段遠心ポンプの安定したReynolds平均Navier-Strokes(RANS)シミュレーションです。4,800万頂点の非構造化混合要素メッシュとインペラ回転速度1,600 RPMで構成されます。OCIおよびAWSのCFDコードは、Intel 2021およびIntel MPI 2021でコンパイルされました。

OCIおよびAWSのインスタンスに次の仕様を使用しました。

OCI HPCAWS HPC
Instance TypeBM.Optimized3.36hpc6a.48xlarge
CPUIntel Xeon 6354AMD EPYC 7R13
Cores Per Node3696
Memory512 GB384 GiB
Interconnect100 Gbps RDMA100 Gbps EFA
Storage3.84 TB NVMe SSDAmazon FSx for Lustre

ベンチマーク・テスト・ケースの結果

日本のターボ機械協会(TSJ)が実施したHPCプロジェクト(FY2012-)のワーキング・グループ2は、ポンプの幾何学的データを提供しました。JAXA(筑波)の根岸秀世氏は、この評価のための計算グリッドとソリューション・ファイルを提供しました。Tim Weathers氏(CRAFT Tech)はベンチマークを実行しました。

A point-line chart comparing the iterations of number of processers over time on OCI and AWS where lower is better.

Figure 2: Time taken in seconds to complete one iteration of CRUNCH CFD v3.4 Solver on OCI and AWS

A point-line chart comparing the speedup of the CRUNCH CFD v3.4 Solver on OCI and AWS.

Figure 3: Speedup comparing OCI and AWS for CRUNCH CFD v3.4 Solver

A point-line chart comparting the parallel efficiency of OCI and AWS running the CRUNCH CFD v3.4 Solver.

Figure 4: Parallel Efficiency comparing OCI and AWS for CRUNCH CFD v3.4 Solver

まとめ

このテストでは、OCIのBM.Optimized3.36は、CRUNCH CFD v3.4ソルバーにおいて、96-1920コアでAWSと比較して32-41%の性能向上を実現しています。したがって、IntelのIce Lakeマシンを使用するOracleのHPCクラスタは、CRUNCH CFD用のAWS 3世代AMD EPYCプロセッサよりも、明らかなパフォーマンス上の優位性を示しています。

CRUNCH CFDにより、他のCFDアプリケーションはOCIでこれまでよりも高速に実行されています。これらのアプリケーションを自分でテストする場合は、30日間の無料トライアルを開始し、30日間の広範なOracle Cloud Infrastructureサービスにアクセスしてください。

謝辞

  • このポンプの幾何学的データは、日本のターボ機械協会(TSJ)が実施するHPCプロジェクト(FY2012-)のワーキング・グループ2によって提供されています。
  • この評価のための計算グリッドおよび解答ファイルは、JAXA(筑波)の根岸秀世氏によって提供されています。
  • Tim Weathers氏(CRAFT Tech)にベンチマークを実行いただきました。