他の利用者のジョブ投入状況を確認したい
他の利用者様のジョブ投入状況を確認することは出来ません。ご了承くださいませ。
利用者様の方で、ご自身のディスク領域に対して、特定のライブラリやアプリケーションをインストールされる場合、許可は不要です。(管理者権限を要しない場合は、許可不要です。)
センター側でのインストールを希望する場合は、下記のお問い合わせフォームよりご連絡くださいませ。(管理者権限を要する場合は、ご連絡ください。)
お問い合わせフォーム
ライブラリやアプリケーションの内容によっては、お断りする場合や、利用者様自身でのインストールをお願いする場合がございます。あらかじめご了承くださいませ。
ワークフロー実行機能あるいはリクエスト連携機能を使用することで可能です。
ワークフロー実行についての詳細は下記マニュアルの7.ワークフローをご参照くださいませ。
リクエスト連携機能については下記マニュアルの1.2.22. リクエスト連携機能をご参照くださいませ。
NQS利用の手引き
リクエスト連携機能とではアサインされるタイミングが異なります。ワークフローの場合、投入後すぐに全リクエストがアサイン対象になりますが、リクエスト連携機能の場合、前のリクエストの実行が完了した時点でアサインされます。そのため、混んでいる場合にはワークフローの方が早く実行される可能性があります。
プライマリセンターから発行されるアカウントです。HPCIが提供するシングルサインオンを行う際に必要となります。
大阪大学サイバーメディアセンターをプライマリセンターに指定している場合は、利用者番号という形でお知らせしております。
資源提供機関(利用する計算機を運用する機関)から発行されるアカウントです。計算機を利用する際に必要になるアカウントになります。
(HPCIアカウントを使ったシングルサインオンでも計算機を利用可能です)
大阪大学サイバーメディアセンターの計算機を使用する場合は、利用者番号という形でお知らせしております。
これらについての詳細は下記のページをご参照ください。
HPCIポータルサイト
下記の場合、HPCIアカウントとローカルアカウントは同じものを割り当てます。ご注意くださいませ。
プライマリセンター:大阪大学サイバーメディアセンター
資源提供機関:大阪大学サイバーメディアセンター
ほぼ全ての環境変数は、#PBS -v によってMPIスレーブノードに対しても指定することができますが、いくつかの環境変数はスケジューラNQSIIの標準機能(#PBS -v)で指定することが出来ません。PATHもその一つになります。指定できない環境変数については下記マニュアルの1.16 qsub(1)をご参照ください。
NQSII 利用の手引き(OCTOPUS)
NQSV 利用の手引き(SQUID)
MPI実行時オプションをご利用いただくことで、これらの環境変数をスレーブノードに対して設定することが可能です。
多くの擬似乱数生成関数は指定した初期値(random seed)に対して、ある一定の規則に基づいた処理を行い、乱数を生成します。同じ初期値を与えた場合は、常に同じ乱数が生成されますので、独立した乱数を生成した場合は、その度に初期値を変更する必要があります。
利用者様の方では、混雑状況を確認することは出来ません。
空いておりましたら、すぐにASG状態(アサイン状態:実行がスケジューリングされた状態)になりますので、sstatコマンドで表示されるSTT項目の結果をもって判断いただけますと幸いです。
もし何かスクリプトやシステムに問題があって、QUE状態になっている場合は、こちらからお知らせいたします。
資源追加の申請につきましては、以下の利用者管理WEBシステムから申請頂いております。
利用者管理システム(要認証)
申請手順につきましては、以下のHPにまとめておりますので、ご参照ください。
一般利用(学術利用) 資源追加申請
F_UFMTENDIAN環境変数を指定することで可能です。
ただし、当センターで採用しておりますスケジューラ(NQSII)の仕様で、「setenv」で環境変数を指定すると、マスターノードにのみ有効に働き、スレーブノードには反映されません。(マルチノードジョブの場合です。シングルノードジョブの場合ですとsetenvでも問題なく動作します。)
ジョブスクリプトの中で、以下のように指定していただくと、すべてのノードに反映されます。
--------------
#PBS -v F_UFMTENDIAN=[装置番号]
--------------
【参考情報】
ジョブスクリプト 環境変数の指定
NQSIIマニュアル(p.342 - p.343) ※利用者番号で認証が必要
ファイル形式が、BOM(Byte Order Mark)付きの形式となっており、バッチスクリプトの1行目のシェル指定が正しく認識されていない可能性があります。
BOM付きかどうかは、下記で確認可能です。
% file nqs.sh
BOMはviなどのエディタで編集可能ですので、削除いただいた上で、再度ジョブの投入をお願いいたします。
下記に、viでの編集例を示しています。
編集例
% vi -b nqs.sh (-bオプションを付けてください)
<feff>#!/bin/csh
^^^^上記の<feff>という文字がBOMとなります。こちらを削除し、保存してください。
出力される情報はマニュアルに記載しておりますので、以下の「2.13.6 MPI プログラム実行性能情報」をご覧ください。(要認証)
MPI/SX 利用の手引き
※ご注意
ノード間をMPI、ノード内はOpenMPで並列化して実行した場合、
ユーザ時間:UserTimeやシステム時間:SysTimeとして出力される情報は、
プロセス単位のCPU時間となります。したがって、各コアの実行時間を積算した値が表示され、RealTime:経過時間よりも長い時間が出力されることがありますので、ご注意ください。
投入したジョブクラスに誤りがある可能性があります。
再度ご確認の上、問題なさそうであれば下記までご連絡ください。
お問い合わせ
オプションF_ERROPTnを利用することで、エラーを抑制(回避)することが可能です。
setenv F_ERROPTn n1,n2,alt,err,m,t,a,cnt
n,n1,n2,alt,err,m,t,a,cntに、それぞれパラメータを設定する必要があります。
実行時に下記のようなエラーが出力される場合
271 DPWR -> underflow in D**I : D=XXX I=YYY PROG=test ELN=ZZ(ZZZZ) TASKID=1
ジョブスクリプトに下記のようにオプションを指定することで、
プログラム実行時に該当するエラーを検出せずに、動作し続けるようになります。
setenv F_ERROPT1 271,271,2,2,2,2,2,2
設定内容は下記のようになります。
F_ERROPT1 …F_ERROPT1~F_ERROPT9までを設定することができます。
複数指定した場合、値の小さい方から評価されます。今回は1つだけなので"1"を指定しています。
271,271, …制御を変更したいエラーの「エラー番号」を指定します。複数指定が可能で、始点終点をコンマ区切りで指定します。
今回は271番のエラーのみなので、始点終点に271を指定しています。
2, …利用者エラー処理ルーチンの実行有無を設定します。この例では「実行しない」設定にしています。
2, …入出力文にERR 指定子が指定されている場合に、指定された文へ制御を移すかどうかを指定します。
この例では「制御を移さない」設定にしています。
2, …エラーメッセージを出力するかどうかを指定します。この例では「出力しない」設定にしています。
2, …トレースバックメッセージを出力するかどうかを指定します。この例では「出力しない」設定にしています。
2, …エラー検出時にプログラムを終了するかどうかを指定します。この例では「終了しない」設定にしています。
2 …エラー検出時にエラー発生回数に数えるかどうかを指定します。この例では「数えない」設定にしています。
上記オプションはエラーの根本解決にはなりませんので、多用はお勧めしません。
ご理解いただいた上で、ご利用ください。
詳細は「FORTRAN90/SXプログラミングの手引」のF_ERROPTnオプションの項をご覧ください。
当該エラーメッセージは、qsub/qstatコマンドのライセンス数制限を超過していることを示しています。
ライセンス数は十分な数を用意しておりますが、コマンドの実行が集中した場合に、一時的に不足する可能性があります。
当該エラーメッセージを確認された場合は、以下からご連絡くださいませ。
お問い合わせフォーム
ジョブの投入時間と経過時間の指定により、実行されるタイミングがやや異なりますが、基本的には正しく実行されます。
※共有利用の場合は、他の利用者の投入状況によって実行されない場合がございます。
詳細は下記をご覧ください。
投入したジョブの実行終了予定時刻が、メンテナンス開始時刻を超えていた場合、メンテナンス終了後まで実行されません。
実行終了予定時刻は、「投入時間」とジョブスクリプトに記載した「経過時間の指定(elapstime_req)」から算出します。
例えば、ジョブスクリプトに「elapstime_req=5:00:00」と記載したジョブを、13:00に投入した場合、
実行終了予定時刻は18:00となります。
※共有利用の場合は、上記に関わらず、他の利用者の投入状況によって実行されない場合がございます。
※年度末メンテナンスの場合、メンテナンス終了時点で全てのジョブを削除します。
正常に実行されます。(メンテナンスの終了を待たずに実行可能です)
前述の通り、メンテナンス終了後まで実行されません。
投入されたジョブはQUE状態のまま受け付けられ、メンテナンス終了後に実行されます。
年度末メンテナンスの場合、全てのジョブが削除されますのでご注意ください。
「経過時間の指定(elapstime_req)」を調整し、
実行終了予定時刻がメンテナンス時刻を超えないようにして、再投入することで、実行できる可能性があります。
もしお急ぎの場合は、お試しください。
占有利用等で、長時間のジョブを実行されている方が対象となります。
メンテナンス開始までは正常に実行されます。
メンテナンス中は、計算を実行できませんので、停止をお願いすることがございますが、ご了承ください。
該当している場合、こちらからご連絡いたします。
メンテナンス終了後まで実行されません
投入されたジョブはQUE状態のまま受け付けられ、メンテナンス終了後に実行されます。
正常に実行されます。
ELN情報には、サブルーチン内の問題箇所の行番号が出力されます。
プリプロセッサを動作させている場合は、中間ファイルの行番号がELNとして出力されますのでご注意下さい。
-adv
演算プロセッサ(AP)における先行制御の状態を変更することを指定する。
すなわち、先行制御機能をプログラム単位の入口で設定し、出口で回復することを指定する。-adv on プログラム単位の入口で動作状態にし、出口で回復することを指定する。
-adv off プログラム単位の入口で停止状態にし、出口で回復することを指定する。
例えば、ある手続きに対してハードウェアの先行制御を抑止したい場合は
-adv off を指定してください。
ただし、本オプションを指定した場合、著しくプログラムの実行性能が
低下します(実行時間が10倍あるいはそれ以上にもなることがあります)。
このため、ご使用される場合は、むやみに指定するのではなく、先行制御を
抑止して実行する区間が可能な限り短くなるようにしてください。
また、コンパイラの行う最適化によって発生しないはずの例外が発生したり、
あるいは発生する例外の位置や回数が変わったりもしますので、この点にも
ご注意ください。「FORTRAN90/SX プログラミングの手引」
「4.4 最適化機能を使用する場合の注意」を参照ください。
閲覧には利用者番号での認証が必要となりますので、ご注意ください。
FORTRAN90/SX プログラミングの手引
こちらの「付録D 実行時のメッセージ」「D.1.1 エラーメッセージの形式」という個所をご確認ください。
各コンパイラのマニュアルをご参照ください。
マニュアルは下記に置いております。閲覧いただく場合、利用者番号での認証が必要となります。
(質問の補足)
(回答)
データ書き込みは、下記のような仕組みで行っています。
それぞれバッファやキャッシュに溜め込む形で、書き出し処理を行っているため、フロントエンドでファイルが確認できるまで時間を要します。
プログラムからの print 実行時、F_SETBUF の設定により、ファイルへのwrite 発行契機が変わります。
write が発行されると、データキャッシュに writeデータを書き込みます。データキャッシュ内のデータは、下記を契機に IOサーバへデータを送信します。
「1. FORTRAN側の動作」による影響は小さいと予想されるため、時間がかかる原因としては主に「2. ファイルシステム側の動作」のデータキャッシュサイズによるものです。
リアルタイムに近い出力を希望される場合、FORTRANプログラム内にて、print実行後に、call flush(6) を実行し、標準出力への内容をフラッシュしていただく必要があります。
これにより、flush実行毎にリダイレクト先ファイルへ反映されます。
※当センターのファイルシステムは、ScateFS(Scalable Technology File System)という独自のファイルシステムを搭載しております。「2.ファイルシステム側の動作」の挙動はScateFSの仕様によるものです。
※sxf03コンパイラは対応していません。
接続方法はこちらをご覧ください。
ログイン方法
HPCIやJHPCN-HPCIシステムで利用する場合は、こちらをご覧ください。
ログイン方法(HPCI利用者向け)
当センターで提供しております大規模計算機システムの利用資格、利用規定を下記に掲載しております。ご覧くださいませ。
環境変数やオプションはsetenvも設定できますが、マルチノードでジョブを実行した場合は、
スレーブノードにsetenvで指定した環境変数が設定されません。
マルチノードでジョブを実行する場合は、NQSIIの-vオプションをご利用ください。
#PBS -v [環境変数orオプション]=[設定内容]
のように指定します。
過去に、(株)日本電気と本センターが協力してチューニングした事例をご紹介いたします。
なお、利用者番号での認証が必要となっておりますので、ご了承ください。
基本的に、再コンパイルが必要となります。移行手順は以下をご参照ください。
SX-ACEからSX-Aurora TSUBASAへの移行の流れ