年度末が近づき、汎用CPUノード群の利用が増加しており、実行待ち時間が長期化しております。
そのため、1月に予定している予定している以下システムメンテナンス終了後の 1月15日(水)AM10時から
停止期間:2025年1月12日(日) 10:00 - 2025年1月15日(水) 10:00
SQUIDに実装されているクラウドバースティング機能を有効化し、
一部の小規模ジョブをオラクル社のパブリッククラウドである Oracle Cloud Infrastructure(OCI)の計算資源で実行可能にいたします。
本機能をご利用いただくことで、小規模ジョブについて通常より短い待ち時間でジョブを実行できる可能性があります。
対象となるジョブ実行を希望される方は、以下の注意事項をご確認の上、ぜひクラウドバースティング機能をご活用ください。
対象
現時点では、本機能は SQUID 汎用CPUノード シェアキュー(SQUID-S)をご利用の皆様を対象に、OCIへの計算要求のオフロードを実行しております。
ポイント消費について
OCIの計算資源を利用してジョブを実行した場合も、消費されるポイントは「汎用CPUノード シェアキュー(SQUID-S)と同等」です。
高額な追加料金が発生することはございませんので、安心してご利用ください。詳細は以下に記載しております。
クラウドバースティング利用方法
OCIの計算資源を利用するには、ジョブ要求用のシェルスクリプトファイル(ジョブスクリプトファイル)にオプションを追加し、スケジューラに対して投入します。
以下にジョブスクリプトの例を示します。
1 2 3 4 5 6 7 8 9 10 11 12 13 14 |
#!/bin/bash #------- qsub option ----------- #PBS -q SQUID-S #クラウドバースティングを利用できるキューは、SQUID-Sのみです。 #PBS --group=G01234 #所属するグループ名 #PBS -l cpunum_job=36 #使用するCPUコア数の要求値 #PBS -l elapstim_req=01:00:00 #ジョブの最大実行時間の要求値 *1時間を超えるジョブは、クラウドバースティングの適用対象外となります。 #PBS --enable-cloud-bursting=yes #クラウドバースティングすることを許可します。 #PBS -U cloud_wait_limit=04:00:00 #待ち時間が指定時間を超える場合、バースティング対象ジョブとなり、クラウドで実行されることがあります。 4時間の例 #------- Program execution ----------- module load BaseCPU #ベース環境をロードします cd $PBS_O_WORKDIR #qsub実行時のカレントディレクトリへ移動 ./a.out > result.txt #プログラムの実行 |
注意事項
1.OCI上の計算ノードのハードウェア構成はSQUID汎用CPUノードと異なるため、計算時間・結果が変わる可能性がございます。
・SQUID汎用CPUノード:
プロセッサ:Intel Xeon Platinum 8368 (Icelake / 2.40 GHz 38コア)2基
主記憶容量:256GB
・OCI汎用CPUノード:
プロセッサ:Intel Xeon 6354 (Icelake / 3.0 GHz 18コア)2基
主記憶容量:512 GB
2.クラウドバースティング機能をONにして、OCIの計算資源を利用された場合でも、SQUID汎用CPUノードのシェアキュー(SQUID-S)と同等のポイントが消費されます。
すなわち、
ジョブを実行したノード時間 x 汎用CPUノード シェアキューの消費係数(0.2248)x 汎用CPUノードの燃料係数 x 汎用CPUノードの季節係数
という計算式となります。
3.クラウドバースティング機能をONにした場合、以下の点についてご理解の上、利用いただいたものとみなします。
・OCI上の計算資源で計算が行われる可能性があります。
・リソースの空き具合によっては、OCIの計算資源が利用されず、SQUID上のCPUノードのみで計算が行われる場合があります。
4.クラウドノードでは、Lustre領域がNFSマウントされており、I/O性能がLustreマウントされたSQUID汎用CPUノードよりも低下します。
このため、特にI/O処理が多いプログラムでは、計算時間に遅延が発生する可能性があります。
上記をご確認の上、クラウドバースティング機能をご活用いただければ幸いです。
Posted : 2025年01月10日