(終了)SQUIDファイルシステム(Lustre)のI/O遅延について(10/4 - 10)

10/10 10時追記
 

10/4から発生しているSQUID ファイルシステム(Lustre)のI/O遅延への対処のため、
現在もSQUIDの緊急メンテナンスを実施しております。
 

この度、障害の原因調査および復旧作業が完了しましたので、本日 10/10 の13:00に全てのサービスを再開いたします。
SQUIDへのジョブ投入・実行やONION-fileへのアクセスも可能となります。
 

長期間のサービス停止となり、まことに申し訳ありませんでした。
よろしくお願いいたします。
 

-----

10/6 15時追記
 

10/4より、SQUID ファイルシステム(Lustre)にてI/Oの遅延が発生しており、
対処のため、10/5 午前10時よりSQUIDの緊急メンテナンスを実施しております。
 

現在もメンテナンスを継続しておりますが、
以下のとおり、10/6 15時より一部サービスを再開いたします。
SQUIDへのジョブ投入・実行はできませんので、ご了承のほどお願いいたします。
 

◆SQUID
HPCフロントエンドサーバ(squidhpc.hpc.cmc.osaka-u.ac.jp)へのログインが可能となります。
HPDAフロントエンドサーバへのアクセスはできません。
ファイルシステム上のデータにアクセスすることは可能ですが、
ジョブ投入・実行が出来ませんので、ご注意ください。
 

◆ONION
ONION-file のサービスを停止いたします。
システムへのログイン、ファイルのアップロードやダウンロードが行えなくなります。
なお、ONION-object はメンテナンスの対象外となり、正常にご利用いただけます。
 

◆OCTOPUSやその他のWEBシステム
メンテナンスの対象外となり、正常にご利用いただけます。
 

長時間のサービス停止となり、大変申し訳ありません。
状況が変わりましたら、またご報告いたします。
以上、よろしくお願いいたします。
 

-----

10/5 10時追記
 

本件の対処のため、10月5日(木) 10時より緊急メンテナンスを実施いたします。
ご迷惑をおかけし、大変申し訳ありません。
終了しましたらあらためてお知らせいたします。
 

◆SQUID
すべてのサービスを停止いたします。
ログインおよびジョブ投入・実行が出来なくなりますので、ご注意ください。
現在実行中のジョブについては、Rerun処理(再実行)を実施いたします。
メンテナンス後に最初から実行されることとなります。該当する方には個別にお知らせいたします。
 

◆ONION
SQUIDと連携するExaScaler、ONION-file のサービスを停止いたします。
システムへのログイン、ファイルのアップロードやダウンロードが行えなくなります。
なお、ONION-object はメンテナンスの対象外となり、正常にご利用いただけます。
 

◆OCTOPUSやその他のWEBシステム
メンテナンスの対象外となり、正常にご利用いただけます。
 

-----
10月4日(水)より再び、SQUID ファイルシステム(Lustre)にてI/Oの遅延が発生しております。
具体的には、以下の現象が発生しております。
 ・計算ノードで実行しているジョブが遅延する
 ・フロントエンドサーバでのコマンド操作が遅延する
 
現在、原因調査および復旧作業を実施しております。ご迷惑をおかけし、大変申し訳ありません。




Posted : 2023年10月04日