(7/3 16:00追記)
発生時間と影響範囲についてご連絡いたします。
【発生時間について】
7/2 17:18に一部のIOサーバで障害が発生し、停止しておりました影響で、
システムへのログインができない状態となっておりました。
7/3 11:02に対象となるIOサーバの復旧が終了し、
こちらで動作の確認を実施した後、13:00頃にご連絡いたしました。
【影響範囲について】
・ファイルIOの遅延、ハングアップ
・dfコマンドでの遅延、ハングアップ
・実行ジョブへの影響
障害発生中に、実行状態にあったジョブ全てに影響しております。
※一部ジョブは、ファイルIO遅延の影響を受けたことで、
経過時間の超過、あるいはその他の理由で強制終了しております。
対象となる利用者様へは、別途ご連絡いたします。
※正常終了したジョブについても、ファイルIO遅延の影響を受け、
計算結果が正しく出力されていない可能性がございます。
この点をご留意いただき、利用者様にてご確認をお願いいたします。
本障害で影響を受けた可能性のあるジョブ(障害発生から復旧までに実行状態に
あったジョブ)については、ノード時間を消費しないよう、処理しております。
この度はご迷惑をお掛けし、大変申し訳ありませんでした。
--------------
一部のIOサーバで障害が発生し、停止しておりました影響で、
システムへのログインが出来ない状態となっておりました。
7/3 13:00頃に対処を完了し、現在正常に動作しております。
本障害の発生時刻や影響範囲については、現在調査中です。
改めてご連絡いたします。
この度はご迷惑をお掛けし、大変申し訳ありませんでした。
--------------
7月3日8:00現在、大規模計算機システムのloginサーバへの
ログインができない状態となっております。
現在、原因を調査中です。
復旧次第、ご連絡いたします。
ご迷惑をお掛けし、大変申し訳ありません。
Posted : 2015年07月03日