SQUIDのジョブクラスは以下のようになっております。使用するノード群や利用方法(共有/占有)毎にジョブクラスが異なりますので、ご注意ください。
汎用CPU計算ノード群
利用方法 | ジョブクラス | 利用可能 経過時間 |
利用可能 最大Core数 |
利用可能メモリ | 同時利用 可能ノード数 |
備考 |
---|---|---|---|---|---|---|
共有利用 | SQUID | 120時間 | 38,912 Core (76Core×512ノード) |
124 TB (248GB×512ノード) |
512ノード | |
SQUID-R | 120時間 | 38,912 Core (76Core×512ノード) |
124 TB (248GB×512ノード) |
257~512ノード | クラスタを跨ぐ割当を許可※1 | |
SQUID-H | 120時間 | 38,912 Core (76Core×512ノード) |
124 TB (248GB×512ノード) |
512ノード | 高優先度キュー※2 | |
SQUID-S | 120時間 | 38 Core (76Core×0.5ノード) |
124 GB (248GB×0.5ノード) |
0.5ノード | ノード内共有キュー※3 | |
DBG | 10 分 | 152 Core (76Core×2ノード) |
496 GB (248GB×2ノード) |
2ノード | デバッグ用 | |
INTC | 10 分 | 152 Core (76Core×2ノード) |
496 GB (248GB×2ノード) |
2ノード | インタラクティブ利用 | |
占有利用 | mySQUID | 無制限 | 76Core×占有ノード数 | 248GB×占有ノード数 | 占有ノード数 |
※1 汎用CPUノード群は、513ノード、513ノード、494ノードをそれぞれ1クラスタとし、クラスタ内でフルバイセクション(半数のノードが同時に残り半分のノードにデータを送信しても、ネットワーク内での競合が発生しない)の構成にしています。各クラスタ間の接続はクラスタ内に比べると、ネットワーク帯域が狭くなっています。当該キューを利用すると、クラスタを跨ぐ(相互接続網の帯域が狭い経路の)割当を許容します。したがって、割り当て方によってはSQUID、SQUID-Hに比べノード間の通信に時間がかかり、実行時間が伸びる可能性があります。ただし、混雑している場合、実行待ち時間が短縮される場合があります。
※2 高優先度のため実行待ち時間を短縮されるが、ポイントの消費が大きくなる。
※3 他のジョブとの1ノード内での資源共有を許容するキュー。ポイント消費が小さくなるが、他のジョブの影響を受ける可能性がある。
GPUノード群
利用方法 | ジョブクラス | 利用可能 経過時間 |
利用可能 最大Core数 |
利用可能メモリ | 同時利用 可能ノード数 |
備考 |
---|---|---|---|---|---|---|
共有利用 | SQUID | 120時間 | 2,432 Core (76Core×32ノード) |
15.75 TB (504GB×32ノード) |
32ノード | 1ノードあたりGPU8枚 |
SQUID-H | 120時間 | 2,432 Core (76Core×32ノード) |
15.75 TB (504GB×32ノード) |
32ノード | 1ノードあたりGPU8枚 高優先度キュー※1 |
|
SQUID-S | 120時間 | 38 Core (76Core×0.5ノード) |
252 GB (504GB×0.5ノード) |
0.5ノード | GPU最大4枚まで ノード内共有キュー※2 |
|
DBG | 10 分 | 152 Core (76Core×2ノード) |
1,008 GB (504GB×2ノード) |
2ノード | 1ノードあたりGPU8枚 デバッグ用 |
|
INTG | 10 分 | 152 Core (76Core×2ノード) |
1,008 GB (504GB×2ノード) |
2ノード | 1ノードあたりGPU8枚 インタラクティブ利用 |
|
占有利用 | mySQUID | 無制限 | 76Core×占有ノード数 | 504GB×占有ノード数 | 占有ノード数 |
※1 高優先度のため実行待ち時間を短縮されるが、ポイントの消費が大きくなる。
※2 他のジョブとの1ノード内での共有を許容するキュー。ポイント消費が小さくなるが、他のジョブの影響を受ける可能性がある。
ベクトルノード群
利用方法 | ジョブクラス | 利用可能 経過時間 |
利用可能 最大Core数 |
利用可能メモリ | 同時利用 VE数 |
備考 |
---|---|---|---|---|---|---|
共有利用 | SQUID | 120時間 | 2,560 Core (10Core×256VE) |
12 TB (48GB×256VE) |
256VE | ノード(8VE)単位で割当 |
SQUID-H | 120時間 | 2,560 Core (10Core×256VE) |
12 TB (48GB×256VE) |
256VE | ノード(8VE)単位で割当 高優先度キュー※1 |
|
SQUID-S | 120時間 | 40 Core (10Core×4VE) |
192 GB (48GB×4VE) |
4VE | ノード内共有キュー※2 | |
DBG | 10分 | 40 Core (10Core×4VE) |
192 GB (48GB×4VE) |
4VE | デバッグ用 | |
INTV | 10分 | 40 Core (10Core×4VE) |
192 GB (48GB×4VE) |
4VE | インタラクティブ利用 | |
占有利用 | mySQUID | 無制限 | 10Core×占有VE数 | 48GB×占有VE数 | 占有VE数 |
※1 高優先度のため実行待ち時間を短縮されるが、ポイントの消費が大きくなる。
※2 他のジョブとの1ノード内での共有を許容するキュー。ポイント消費が小さくなるが、他のジョブの影響を受ける可能性がある。
資源の制限について
各キュー毎に、経過時間、CPU数、メモリ量、同時実行ノード数の制限を設けています。
ジョブスクリプトで資源量を指定をする際は、制限を超えないように指定する必要があります。