※ 本記事は、Amit Rajkhowa, Calvin Smithによる”Announcing General Availability of OCI Compute with AMD Instinct MI355X GPUs – For Next-generation AI Training and Model Development at Zettascale“を翻訳したものです。

2025年10月24日


OracleとAMDは協力して、現在市場で利用可能な最も価格性能の高いCPUおよびGPUソリューションの一部を提供しており、強力なコンピュート・オプションを世界中のお客様に提供しています。2024年のAMD Instinct™ MI300X GPUベースのベア・メタル・インスタンスの起動後、Oracleでは、AMD Instinct™ MI355X GPUを搭載したOCI Compute Bare Metalインスタンスの導入に期待しています。

Instinct MI355Xは、次の要素を含む、メモリー容量、GPUパフォーマンス、システム・リソースおよび全体的なスケーラビリティの大幅な向上を実現する、複数のディメンションにわたって前世代に大きな飛躍をもたらします:

  • GPUメモリーおよび帯域幅 – 288GB GPUメモリー(前世代比1.5倍) 8TB/秒の帯域幅(51%増加)により、Instinct MI355Xは大規模なモデルを処理し、より高速なAIトレーニングおよび推論のためのメモリー・ボトルネックを削減します。
  • 浮動小数点精度書式 – 高度なCDNA4に基づいて構築されたInstinct MI355Xは、FP4、FP6およびFP8の精度書式をサポートし、効率を最適化し、前世代よりも2.5倍のFP8/FP16のパフォーマンス向上を実現します。
  • システム・リソース – Instinct MI355Xシステムは、CPUコアを14%増やす(128対112)ことでパフォーマンスを向上させ、メモリー容量を53%増やす(2.3TBのHBM3e対1.5TBのHMB3)ことで、要求の厳しいワークロードと大規模なインメモリー・データセットの処理能力を向上させます。さらに、ローカル・ストレージは100%増加し、61.44TBに達します。大規模なデータセットやモデルへの迅速なアクセスを実現し、低速な外部ストレージへの依存を減らします。
  • ネットワークとスケーラビリティ – 400Gbpsフロントエンド・ネットワーク(前世代より4倍高速)と最大64個のGPUをサポートする液体冷却ラックにより、AMD Instinct MI355Xは、大規模なAI導入のための優れたスループット、低レイテンシ、および強化されたコンピュート密度を提供します。

この発表により、Oracleは、AMD MI355X GPUを公的に提供する初のハイパースケーラとなり、MI355XとMI300Xの両方を提供する唯一のハイパースケーラとなり、AI、HPC、その他の要求の厳しいワークロードに最先端のインフラストラクチャと幅広いコンピュート・オプションを提供するという当社の取り組みを強化しました。

 

A black rectangular device with a square and a square with a square and a square with a square with a square with a square with a square with a squareAI-generated content may be incorrect.

OCI ComputeのInstinct MI355X GPUベア・メタル・インスタンス:

  • インスタンス名: BM.GPU.MI355X.8
  • GPUs: 8 x AMD Instinct™ MI355X Accelerators (288 GB Matrix Core)
  • GPUメモリー: 2.3 TB HBM3e
  • CPUおよびシステム・メモリー: 128 cores 5th Gen AMD EPYC™ Processors with 3 TB DDR5
  • ローカル・ストレージ: 61.44 TB
  • ネットワーク: 400 Gbps Front-End and 3,200 Gbps Cluster Network
  • 業界をリードするGPUクラウド・コンピューティングの価格、1時間あたり8.60ドル

 

お客様は、大規模な生成AI、リアルタイム推論、複雑なモデル・トレーニングを強化するために、Oracle Cloud InfrastructureでAMD Instinct™ MI355X GPUを選択しています。特に、膨大なコンピュート能力を必要とするマルチモーダルAIモデル向けです。AIアプリケーションが大規模で複雑なデータセットを処理するため、チームは大規模なトレーニングと導入専用に設計されたソリューションを必要とします。

そこで、zettascale OCI Superclusterが登場します。高スループット、超低レイテンシのRDMAクラスタ・ネットワークにより、最大131,072 GPUまで拡張できるため、クラウド内最大のハイパースケールAIスーパーコンピュータになります。直感的なMI355X GPUは、前世代よりもコンピューティング能力の3倍近く、高帯域幅のメモリを50%以上提供することで、AIのブレークスルーを加速するために必要なパフォーマンスとスケーラビリティをお客様に提供します。

利点と理想的なユース・ケース

アーキテクチャの利点: Instinct MI355Xチップレット・アーキテクチャとHBM3Eを使用すると、効率的なAIおよびHPCパフォーマンスが可能になります。288GBのメモリと8TB/秒の帯域幅で、より低速なシステム・リソースへの依存度で、より大きなモデルを処理します。新しいCDNA 4アーキテクチャは、最適化されたマトリクス・コアとデータフロー・スケジューリングを通じて、CDNA 3よりも高密度なAIスループットを倍増させます。
ML/AIモデルの推論、トレーニングおよび開発: 最大のLLMおよび即時利用可能なGPUアクセラレーション・フレームワーク(TensorFlow、PyTorch、ONNX、ランタイムおよびTritonなど)に最適です。大容量メモリと高帯域幅のおかげで、エージェントAI、マルチモデル推論、Mixture of Expert(MoE)モデル、RAGや要約などの長文タスクに高いスループットを実現します。
HPCワークロード: Graph Neural Networks (GNNs)、Computer Aided Engineering (CAE)、Simulation-Based Product Development、Digital Twins、Genomic Sequencing、およびAnalysis、Climate Modeling、Fluid Dynamic Simulations、Financial Modeling、そしてSimulation、Massive-Scale Data Analysis、そしてModeling。
オープン・エコシステム: Instinct MI355Xは、AMDのオープンソースGPUコンピューティング・プラットフォームであるROCm
で動作し、既存のコミュニティベースのAIおよびHPCツールを活用しようとするユーザー向けの開発者フレンドリーなオプションとなります。ROCmには、大規模なリライト/コード変換を行わずに、CUDAコードおよびアプリケーションをROCmに移植するいくつかの方法もあります。

 

OCIとAMDの価格パフォーマンスのメリットを享受しているお客様

Absci、OracleとAMDでAIによる創薬を加速

臨床段階のバイオテクノロジー企業であるAbsciは、Oracle Cloud Infrastructure(OCI)とAMDと提携し、大規模な分子動力学や抗体設計など、生成AIによる創薬を加速しています。OCIのAIインフラストラクチャとAMD Instinct™ GPUを活用することで、Absciはコンピュート・スタックを合理化し、GPU間のレイテンシを2.5μsに短縮し、データ処理のための1秒あたりテラバイトのスループットを実現しました。すべてハイパーバイザのオーバーヘッドは発生しません。

「私たちの使命は、私たちが新しい治療法を設計する方法の境界を押し広げることです」と、Absciの創業者兼CEOであるSean McClain氏は述べています。「OCIとAMDでは、最先端のAIモデルとクラス最高のインフラストラクチャを組み合わせています。このコラボレーションにより、新しい治療薬を患者に提供する能力が加速し、次世代のAIを活用した医薬品発見ワークフローの技術的基盤を築くことができます。」

Seekr、OracleとAMDで正確で説明可能なAIを安全に開発

信頼できるAIに焦点を当てたAI企業であるSeekrは、Oracle Cloud Infrastructure(OCI)との複数年契約に署名し、エンタープライズAIを加速し、次世代のモデルとエージェントを開発しています。このコラボレーションは、SeekrFlow™、OCIの高パフォーマンス・インフラストラクチャ、およびAMD GPUを組み合せて、グローバル規模でのより迅速で効率的なモデル・トレーニングを可能にします。

Seekrの社長、Rob Clark氏は次のように述べています。「OCIは、国際的なインフラストラクチャ・パートナーとして明らかな選択肢でした。何十年もの画像やセンサーデータを分析するトップ衛星プロバイダーや国家向けの次世代ビジョン言語基盤モデルの開発には、大量の生GPU計算能力が必要です。OracleとAMDはどちらも、インフラストラクチャ、トップ・パフォーマンス・マルチノード・トレーニング・コンピュート、国際的なプレゼンス、そしてそれを可能にする考え方とともに登場しました。」

 

はじめに

AMD MI355X GPUを搭載したOCI Computeの発売により、OracleはAIインフラストラクチャのパフォーマンス、スケーラビリティ、コスト効率を向上させます。OCI上のAMD GPUを活用してトップクラスのパフォーマンスと業界をリードする価格設定を実現する大手のお客様がご参加ください。今すぐ始めましょう

Oracle AI World 2025プレス・リリースを読み、OCIとAMD AIインフラストラクチャの完全なラインアップの詳細をご覧ください。