瞬時電圧停下による大規模計算機システムの停止について(7/10)

【2024年7月10日 17:00追記】

瞬時電圧低下に伴い、計算ノードの一部が停止していたことが判明しました。
実行中であったジョブについても、影響を受けております。
詳細が分かり次第、実行していた方に対して個別にご連絡いたします。
影響を受けたジョブについては、自動的にRerun(再実行)いたします。
また、瞬停まで実行された分のSQUIDポイントについては消費しないよう、対応いたします。
 

先ほど、復旧作業を完了しましたので、
現在正常にご利用いただける状態となっております。
ご迷惑をおかけしまして、大変申し訳ありませんでした。
 

ファイルストレージなど、計算ノード以外のサービスについては瞬低の影響を受けず、正常に稼働しておりました。
 

また、ONIONやWEBシステムなど、その他のサービスについても、
正常に動作していることを確認しました。
 

ご協力いただきありがとうございました。
 

----------
 
本日、7月10日 13:57頃にサイバーメディアセンターにて
瞬時電圧停下が発生し、スーパーコンピュータSQUIDの一部サービスが影響を受けております。
 

現在、復旧作業と影響範囲の確認を行っております。
 

ご迷惑をおかけしまして、大変申し訳ありません。
状況が分かり次第、あらためてお知らせいたします。




Posted : 2024年07月10日