SQUID:パブリッククラウド (Microsoft Azure) を活用したクラウドバースティングについて (3/21-)

2025/4/23 追記

クラウドバースティングについてご利用いただきありがとうございました。

現在、クラウドバースティング機能は無効化しております。
今後、再度ご利用可能となった際には、当ウェブサイトにてお知らせいたします。
 
--------------------------------------------------

年度末が近づき、汎用CPUノード群の利用が増加しており、実行待ち時間が長期化しております。この状況を鑑み、1月15日よりSQUIDに実装された"クラウドバースティング機能"を使用し、一部ジョブを対象にOracle Cloud Infrastructure(OCI)で実行できる環境を提供しておりました。
3月21日10:00でOCIを使ったクラウドバースティング機能の提供を終了し、3月21日13:00よりMicrosoft Azureを使ったクラウドバースティング機能を提供いたしますので、お知らせいたします。
本機能をご利用いただくことで、通常より短い待ち時間でジョブを実行できる可能性があります。クラウドノードでのジョブ実行を希望される方は、以下の注意事項をご確認の上、ぜひクラウドバースティング機能をご活用ください。
 

提供開始日時

2025年3月21日 13:00
 

対象

SQUID 汎用CPUノードで"1ノード 1時間以下"のジョブをご利用の皆様を対象に、Microsoft Azureへの計算要求のオフロードを実行します。
※OCIを使ったクラウドバースティング機能と対象が異なりますので、ご注意ください。
 

ポイント消費について

Microsoft Azureの計算資源を利用してジョブを実行した場合も、消費されるポイントは「汎用CPUノードと同等」です。 高額な追加料金が発生することはございませんので、安心してご利用ください。詳細は以下に記載しております。
 

クラウドバースティング利用方法

Microsoft Azureの計算資源を利用するには、ジョブ要求用のシェルスクリプトファイル(ジョブスクリプトファイル)にオプションを追加し、スケジューラに対して投入します。以下にジョブスクリプトの例を示します。

 

注意事項

1.Microsoft Azure上の計算ノードのハードウェア構成はSQUID汎用CPUノードと異なるため、計算時間・結果が変わる可能性がございます。

・SQUID汎用CPUノード:
プロセッサ:Intel Xeon Platinum 8368 (Icelake / 2.40 GHz 38コア)2基
主記憶容量:256GB

・Microsoft Azure 汎用CPUノード:
プロセッサ:Intel Xeon Platinum 8280 (Cascade Lake / 2.70GHz 24コア)4基
主記憶容量:2048 GB
※実際に使用できるリソースは、CPU 76コア、メモリ 248GB です。

24コア/ソケット x 4ソケット の構成になっており、
SQUID汎用CPUノードとはNUMAの構成が異なるため、バースティング時の影響として、
ジョブスクリプトでオンプレ環境を前提としたコア割り当てを指定すると、実行エラーもしくは性能が低下する可能性があります。
 

2.クラウドバースティング機能をONにして、Microsoft Azureの計算資源を利用された場合でも、SQUID汎用CPUノードと同等のポイントが消費されます。

すなわち、ジョブを実行したノード時間 x 汎用CPUノードの消費係数(0.2998)x 汎用CPUノードの燃料係数 x 汎用CPUノードの季節係数
という計算式となります。
 

3.クラウドバースティング機能をONにした場合、以下の点についてご理解の上、利用いただいたものとみなします。

 ・Azure上の計算資源で計算が行われる可能性があります。
 ・リソースの空き具合によっては、Azureの計算資源が利用されず、SQUID上のCPUノードのみで計算が行われる場合があります。
 

4.クラウドノードでは、Lustre領域がNFSマウントされており、I/O性能がLustreマウントされたSQUID汎用CPUノードよりも低下します。

 このため、特にI/O処理が多いプログラムでは、計算時間に遅延が発生する可能性があります。
 

上記をご確認の上、クラウドバースティング機能をご活用いただければ幸いです。




Posted : 2025年03月19日