D3 Center, The University of Osaka » Blog Archive » (終了) OCTOPUS 緊急メンテナンスに伴うサービスの一時停止について

D3 Center, The University of Osaka > (終了) OCTOPUS 緊急メンテナンスに伴うサービスの一時停止について

(終了) OCTOPUS 緊急メンテナンスに伴うサービスの一時停止について

2018/05/15
全ノードのメンテナンスを完了しました。ご迷惑をおかけし、申し訳ありませんでした。

----

現在稼動しているOCTOPUSのスケジューラに不具合があることが判明しました。
ご迷惑をおかけし、誠に申し訳ございません。
この不具合を修正するため、下記の日程にてメンテナンスを実施いたします。
影響を限定的にするため、ノード群にわけて段階的にメンテナンスを行います。

不具合の症状

MPIジョブを実行時に、スレーブジョブが異常終了しMPIプログラムが起動しない。

標準エラー出力に下記のようなエラーが出力される。

エラーが出ているにもかかわらず、経過時間の指定(elapstime_req)一杯まで実行され続ける場合がある。

不具合への対応

この不具合によって消費したOCTOPUSポイントを返却いたします。
該当するユーザの皆様には個別にご連絡いたします。

以下の日程でメンテナンスを実施いたします。

-------------------------------------
5/8(火) 10:00 ～ 12:00

-------------------------------------
5/15(火) 10:00 ～ 12:00

-------------------------------------

メンテナンスの影響：

OCTOPUS

上記の通り各ノード群を分割してメンテナンスを行うため、メンテナンス中も通常どおりジョブの投入や実行が可能です。
稼働ノード数が減少するため、通常よりも待ち時間が長くなる可能性があります。
フロントエンドやストレージへの影響はありません。

SX-ACE、VCCなどその他のシステム

メンテナンスの影響はありません。

注意事項：

経過時間の指定(elapstime_req)が、メンテナンス開始時刻を超えるジョブについては、実行されませんので、ご注意ください。
メンテナンス時のジョブ投入については、下記も併せてご覧ください。
FAQ：計算機のメンテナンス前後に投入したジョブはどのような挙動になるのでしょうか？