10/10 10時追記
10/4から発生しているSQUID ファイルシステム(Lustre)のI/O遅延への対処のため、
現在もSQUIDの緊急メンテナンスを実施しております。
この度、障害の原因調査および復旧作業が完了しましたので、本日 10/10 の13:00に全てのサービスを再開いたします。
SQUIDへのジョブ投入・実行やONION-fileへのアクセスも可能となります。
長期間のサービス停止となり、まことに申し訳ありませんでした。
よろしくお願いいたします。
-----
10/6 15時追記
10/4より、SQUID ファイルシステム(Lustre)にてI/Oの遅延が発生しており、
対処のため、10/5 午前10時よりSQUIDの緊急メンテナンスを実施しております。
現在もメンテナンスを継続しておりますが、
以下のとおり、10/6 15時より一部サービスを再開いたします。
SQUIDへのジョブ投入・実行はできませんので、ご了承のほどお願いいたします。
◆SQUID
HPCフロントエンドサーバ(squidhpc.hpc.cmc.osaka-u.ac.jp)へのログインが可能となります。
HPDAフロントエンドサーバへのアクセスはできません。
ファイルシステム上のデータにアクセスすることは可能ですが、
ジョブ投入・実行が出来ませんので、ご注意ください。
◆ONION
ONION-file のサービスを停止いたします。
システムへのログイン、ファイルのアップロードやダウンロードが行えなくなります。
なお、ONION-object はメンテナンスの対象外となり、正常にご利用いただけます。
◆OCTOPUSやその他のWEBシステム
メンテナンスの対象外となり、正常にご利用いただけます。
長時間のサービス停止となり、大変申し訳ありません。
状況が変わりましたら、またご報告いたします。
以上、よろしくお願いいたします。
-----
10/5 10時追記
本件の対処のため、10月5日(木) 10時より緊急メンテナンスを実施いたします。
ご迷惑をおかけし、大変申し訳ありません。
終了しましたらあらためてお知らせいたします。
◆SQUID
すべてのサービスを停止いたします。
ログインおよびジョブ投入・実行が出来なくなりますので、ご注意ください。
現在実行中のジョブについては、Rerun処理(再実行)を実施いたします。
メンテナンス後に最初から実行されることとなります。該当する方には個別にお知らせいたします。
◆ONION
SQUIDと連携するExaScaler、ONION-file のサービスを停止いたします。
システムへのログイン、ファイルのアップロードやダウンロードが行えなくなります。
なお、ONION-object はメンテナンスの対象外となり、正常にご利用いただけます。
◆OCTOPUSやその他のWEBシステム
メンテナンスの対象外となり、正常にご利用いただけます。
-----
10月4日(水)より再び、SQUID ファイルシステム(Lustre)にてI/Oの遅延が発生しております。
具体的には、以下の現象が発生しております。
・計算ノードで実行しているジョブが遅延する
・フロントエンドサーバでのコマンド操作が遅延する
現在、原因調査および復旧作業を実施しております。ご迷惑をおかけし、大変申し訳ありません。
Posted : 2023年10月04日