2015.03.12
当該エラーメッセージは、qsub/qstatコマンドのライセンス数制限を超過していることを示しています。
ライセンス数は十分な数を用意しておりますが、コマンドの実行が集中した場合に、一時的に不足する可能性があります。
当該エラーメッセージを確認された場合は、以下からご連絡くださいませ。
お問い合わせフォーム
2015.03.04
ジョブの投入時間と経過時間の指定により、実行されるタイミングがやや異なりますが、基本的には正しく実行されます。
※共有利用の場合は、他の利用者の投入状況によって実行されない場合がございます。
詳細は下記をご覧ください。
メンテナンス前にジョブを投入した場合
投入したジョブの実行終了予定時刻が、メンテナンス開始時刻を超えていた場合、メンテナンス終了後まで実行されません。
実行終了予定時刻は、「投入時間」とジョブスクリプトに記載した「経過時間の指定(elapstime_req)」から算出します。
例えば、ジョブスクリプトに「elapstime_req=5:00:00」と記載したジョブを、13:00に投入した場合、
実行終了予定時刻は18:00となります。
※共有利用の場合は、上記に関わらず、他の利用者の投入状況によって実行されない場合がございます。
※年度末メンテナンスの場合、メンテナンス終了時点で全てのジョブを削除します。
ジョブの実行終了予定時刻がメンテナンス開始時刻を超えていない場合
正常に実行されます。(メンテナンスの終了を待たずに実行可能です)
ジョブの実行終了予定時刻がメンテナンス開始時刻を超えている場合
前述の通り、メンテナンス終了後まで実行されません。
投入されたジョブはQUE状態のまま受け付けられ、メンテナンス終了後に実行されます。
年度末メンテナンスの場合、全てのジョブが削除されますのでご注意ください。
「経過時間の指定(elapstime_req)」を調整し、
実行終了予定時刻がメンテナンス時刻を超えないようにして、再投入することで、実行できる可能性があります。
もしお急ぎの場合は、お試しください。
メンテナンスが計画された時点で、メンテナンス開始時刻を超えるジョブを実行している場合
占有利用等で、長時間のジョブを実行されている方が対象となります。
メンテナンス開始までは正常に実行されます。
メンテナンス中は、計算を実行できませんので、停止をお願いすることがございますが、ご了承ください。
該当している場合、こちらからご連絡いたします。
メンテナンス中にジョブを投入した場合
メンテナンス終了後まで実行されません
投入されたジョブはQUE状態のまま受け付けられ、メンテナンス終了後に実行されます。
メンテナンス後にジョブを投入した場合
正常に実行されます。

2015.02.26
ELN情報には、サブルーチン内の問題箇所の行番号が出力されます。
プリプロセッサを動作させている場合は、中間ファイルの行番号がELNとして出力されますのでご注意下さい。
行番号のずれについて
SXのハードウェアは高度な先行処理を行っており、
プログラムの実行時に例外が発生してから実際に検出されるまでの
ごくわずかな時間にも先行して命令を処理しています。
これが原因で、プログラム例外を発生した命令と実際に検出した命令がずれ、行番号の対応が取れないことがあります。このずれはコンパイラが命令の並び替えなどの最適化を行っていると、さらに大きくずれ実際のソースでは何十行とずれた行になることもあります。
このため、例外が発生した行番号を正確に表示するには、ハードウェアの
先行制御を抑止してプログラムを実行する必要があります。
FORTRAN90/SX では -adv詳細オプションを用意しており、このオプションを
指定することでハードウェアの先行制御をコントロールすることができます。
-adv
演算プロセッサ(AP)における先行制御の状態を変更することを指定する。
すなわち、先行制御機能をプログラム単位の入口で設定し、出口で回復することを指定する。
-adv on プログラム単位の入口で動作状態にし、出口で回復することを指定する。
-adv off プログラム単位の入口で停止状態にし、出口で回復することを指定する。
例えば、ある手続きに対してハードウェアの先行制御を抑止したい場合は
-adv off を指定してください。
ただし、本オプションを指定した場合、著しくプログラムの実行性能が
低下します(実行時間が10倍あるいはそれ以上にもなることがあります)。
このため、ご使用される場合は、むやみに指定するのではなく、先行制御を
抑止して実行する区間が可能な限り短くなるようにしてください。
また、コンパイラの行う最適化によって発生しないはずの例外が発生したり、
あるいは発生する例外の位置や回数が変わったりもしますので、この点にも
ご注意ください。「FORTRAN90/SX プログラミングの手引」
「4.4 最適化機能を使用する場合の注意」を参照ください。
SXのエラーメッセージについては、下記にマニュアルをご用意しておりますので、まずご確認いただけますと幸いです。
閲覧には利用者番号での認証が必要となりますので、ご注意ください。
FORTRAN90/SX プログラミングの手引
こちらの「付録D 実行時のメッセージ」「D.1.1 エラーメッセージの形式」という個所をご確認ください。
2015.02.13
「.cshrc」ファイルで、他のシェルを起動していないかご確認ください。
sftp-serverはcshから起動を行いますので、他のシェルを起動しているとsftp-serverが起動できずtimeoutとなります。「.cshrc」ファイルから、他シェル起動の処理を削除の上、再度お試しください。
解決しない場合は、お手数かと思いますが、下記よりご連絡ください。
お問い合わせフォーム
2015.02.12
全ての計算機に共通する利用方法を下記で解説しておりますので、ご参照ください。
基本的な利用方法
2015.02.12
コンパイラは計算機資源毎で異なっております。
詳細については、下記をご覧くださいませ。
SQUIDの利用方法 OCTOPUSの利用方法
2015.02.12
各コンパイラのマニュアルをご参照ください。
マニュアルは下記に置いております。閲覧いただく場合、利用者番号での認証が必要となります。
利用マニュアル
2015.02.10
以下のサイトの「パスワード初期化申請をする」ボタンより申請ください。
Web利用申請システム
2015.02.10
(質問の補足)
計算機で下記のような処理を行ったとします。
./a.out > output.txt
a.outの実行結果はoutput.txtに書き込まれるのですが、計算中にoutput.txtを確認しても、出力結果が反映されるのが非常に遅いのではないか、という質問です。
(回答)
データ書き込みは、下記のような仕組みで行っています。
それぞれバッファやキャッシュに溜め込む形で、書き出し処理を行っているため、フロントエンドでファイルが確認できるまで時間を要します。
「1. FORTRAN側の動作」による影響は小さいと予想されるため、時間がかかる原因としては主に「2. ファイルシステム側の動作」のデータキャッシュサイズによるものです。
リアルタイムに近い出力を希望される場合、FORTRANプログラム内にて、print実行後に、call flush(6) を実行し、標準出力への内容をフラッシュしていただく必要があります。
これにより、flush実行毎にリダイレクト先ファイルへ反映されます。
※当センターのファイルシステムは、ScateFS(Scalable Technology File System)という独自のファイルシステムを搭載しております。「2.ファイルシステム側の動作」の挙動はScateFSの仕様によるものです。
※sxf03コンパイラは対応していません。
関連するFAQ
SX-ACEの標準出力で、MPIの計算結果をリアルタイムに確認したい
2015.02.10
接続方法はこちらをご覧ください。
ログイン方法
HPCIやJHPCN-HPCIシステムで利用する場合は、こちらをご覧ください。
ログイン方法(HPCI利用者向け)
2015.02.10
利用申し込みについては下記をご参照ください。
新規利用申請
2015.02.10
当センターで提供しております大規模計算機システムの紹介に掲載しております。ご覧くださいませ。
システム紹介
2015.02.10
当センターで提供しております大規模計算機システムの利用資格、利用規定を下記に掲載しております。ご覧くださいませ。
利用資格と利用規定
2015.02.10
環境変数やオプションはsetenvも設定できますが、マルチノードでジョブを実行した場合は、
スレーブノードにsetenvで指定した環境変数が設定されません。
マルチノードでジョブを実行する場合は、NQSIIの-vオプションをご利用ください。
#PBS -v [環境変数orオプション]=[設定内容]
のように指定します。
2014.12.18
過去に、(株)日本電気と本センターが協力してチューニングした事例をご紹介いたします。
なお、利用者番号での認証が必要となっておりますので、ご了承ください。
2009年度チューニング報告
2013年度チューニング報告
2014.12.17
いくつかの原因が考えられますので、まずエラーメッセージをご確認ください。
Xサーバ環境が整っていない場合
下記のようなエラーメッセージが表示されます(あくまで一例です)
サーバはこのマシンに転送を試みました。
localhost上のXサーバへの接続を要求しました(ディスプレイ0:0)。
接続は拒否されました(おそらくサービス停止中です)。
転送接続を終了します。
フロントエンドでAVS/Expressをご利用いただく場合、Xサーバ環境を必須となります。
まず下記をご参照いただき、Xサーバ環境の設定をご確認ください。
可視化ソフトウェア AVS/Express Xサーバ環境のアプリケーションを利用する方法
ライセンスが不足している場合
下記のようなエラーメッセージが表示されます。
…
Could not get license from server: license limit exceeded
Found and opened license file: /sc/cmc/apl/AVS/v8.2/express82/license.dat
Product name does not match: LICSERV != EXPRESS
Use-limited licenses must be obtained from a license server
Failed to find a valid license.
…
AVS/Expressは同時利用いただけるライセンス数には限りがございます。
他の人が利用している間は、利用できません。
しばらくしてからもう一度お試しください。
解決しない場合、system{a}cmc.osaka-u.ac.jpまでご連絡ください。
上記に該当しない場合
システムに問題がある可能性があります。
system{a}cmc.osaka-u.ac.jpまでご連絡ください。
2014.12.11
基本的に、再コンパイルが必要となります。移行手順は以下をご参照ください。
SX-ACEからSX-Aurora TSUBASAへの移行の流れ
2014.12.10
ディスク使用状況を確認するコマンドを提供しております。
下記をご覧ください
利用状況の確認方法
2014.08.25
利用終了には特別な手続きは必要ありません。継続申請をしなかった場合に、当年度末をもって利用終了となります。
2014.07.24
以下のコマンドを実行することで、
ジョブの予約状況を確認することが可能です。
sstat
実行開始時刻が決定していると、
STT(スケジューリング状態)がASG(Assigned)となり、PlannedStartTime(実行開始予定時間)に開始時刻が表示されます。詳細は下記をご覧ください。
スケジューラコマンドについて
2014.07.14
基本的にはインストールマシン全ての情報を送付いただく必要があります。
ただ、1台につき1枚の申請書というわけでは無いので、まとめて記載し提出いただいても結構です。
2014.07.14
スクリプトファイルにおける、制御コードに問題がある可能性があります。
当センターのシステムでは、文字コードはUTF-8となっておりますので、パソコンからファイル転送する際は、アスキーコードで送付するか、nkf コマンドで文字コード・改行コードを変換する必要があります。
2014.07.14
ジョブは各利用者様の優先度に応じて、スケジューリングされますので、場合によっては待ち時間が発生することがあります。
以下のコマンドを実行することで、ジョブの予約状況を確認することが可能です。
sstat
実行開始時刻が決定していると、
STT(スケジューリング状態)がASG(Assigned)となり、PlannedStartTime(実行開始予定時間)に開始時刻が表示されます。詳細は下記をご覧ください。
スケジューラコマンドについて
あまりに長時間の待ちが発生する場合は、何らかの制限に抵触しているか、もしくはシステムに問題がある可能性があります。以下までご連絡ください。
system{at}hpc.cmc.osaka-u.ac.jp
2014.07.14
「qwait」コマンドを使用することで、実現可能です。
このコマンドは引数で与えたリクエストID(例:12345.cmc)を待ち合わせするというものです。
指定のリクエストIDのジョブが終了するとメッセージ終了と共にコマンドが終了します。
コマンドの詳細についてはポータルで公開されておりますマニュアル
「NQS利用の手引」のリファレンス編 第1章 ユーザコマンドをご参照頂けますようお願い致します。
NQSII利用の手引き(要認証)
NQSV利用の手引き
※ man qwait でもヘルプを参照できます。
qwait については下記のような使い方が可能です。
監視スクリプトをバックグラウンド実行し、スクリプト内で qwaitを実行します。
exitコード(上記のマニュアルに記載があります)で判定し、その後の動作を分岐させています。
参考にしてください。
-----------
$ qsub job1-1
Request 12345.cmc submitted to queue: Pxx.
$ (./chkjob >& log &)
----- chkjob
#!/bin/sh
while :
do
qwait 12345.cmc #リクエストIDを任意のものに変更して下さい
case $? in
0) qsub job1-2;exit;;
1) qsub job2-1;exit;;
2) qsub job3-1;exit;;
3) echo NQS error | mail xxxx@yyyy.ac.jp;exit;;#メールアドレスを任意のものに変更してください
7) continue;;
*) ;;
esac
done
------------
以上です。
2014.07.14
このエラーの原因は基本的に以下の2つのどちらかとなります。
1.先頭行の "#!" で指定されているコマンド名(通常はシェル名)の絶対パスが誤っている可能性があります。
パスが正しいか、入力ミスが無いかをご確認ください。
2.ジョブスクリプトファイルの改行コードが CRLF (Windows)になっている可能性があります。
スクリプトファイルは、文字コードを "UTF-8"、改行コードを "LF" で作成してください。
改行コードがCRLFのファイルはエディタ(vi,emacsなど)で開いた際、画面下に[DOS]と表記されます。
アップロードする前の対処方法としては下記の通りです。
・文字コードや改行コードを指定できるテキストエディタを利用する。
(秀丸エディタ[シェアウェア] や サクラエディタ 等いろいろあります)
※ 文字コードは "UTF-8"、改行コードは "LF" を指定
・WinSCP でファイルをアップロードする時に転送モードを"テキスト" に設定するか、
ファイルの拡張子をテキストだと自動判別されるもの(.txt , .sh 等)にする。
※ この方法では文字コードには対応できません
またアップロード後であっても、フロントエンドノード上で以下のコマンドを実行することで、
改行コードがCRLFからLFに変換されたsample2.shが生成されます。
2014.07.14
SX用クロスコンパイラの場合、下記のようにコンパイルすることが可能です。
% sxc++ -S a.c
% sxf90 b.f90 a.s
intelコンパイラの場合、下記のようにコンパイルすることが可能です。
% icc -c a.c
% ifort b.f90 a.o
2014.07.14
I-CACHE、O-CAHCEとは、SXにてプログラムを実行後に出力される「プログラム情報※1」内の項目の一つです。
名称)
I-CACHE : 命令キャッシュ(ミス)
O-CACHE : オペランドキャッシュ(ミス)
意味)
スカラユニット用のキャッシュ(I-CACHE、O-CACHE 両方共)。
「プログラム情報」ではプログラム中でベクトル化されていない、
スカラ処理部分におけるキャッシュミス時間を表示している。
キャッシュ構成)
スカラマシンの有している L1 キャッシュと同等の機能。
SX-9 の場合は32KB(256B/キャッシュライン * 64エントリ * 2way)を有している。
チューニング方法)
1.スカラ処理部分を可能な限りベクトル化する。ベクトル化することにより
キャッシュミス時間は自動的に削減される。
2.極限までベクトル化した後もキャッシュミス時間が残る場合、
スカラマシンと同様にキャッシュのスラッシング対策を行う。
具体的には、O-CACHE値等で 2way で追い出し(スラッシング) が
発生しているかどうかを確認し、スラッシングが発生している場合は
配列をずらすことでスラッシングを回避してキャッシュヒット率を高める。
これによりキャッシュミス時間を削減する。
※1プログラム情報
ジョブスクリプトに「setenv F_PROGINF DETAIL」を指定する事で標準エラー出力に出力
出力例(英語):
****** Program Information ******
Real Time (sec) : 1.055745
User Time (sec) : 0.009741
Sys Time (sec) : 0.019627
Vector Time (sec) : 0.000047
Inst. Count : 1887787.
V. Inst. Count : 2284.
V. Element Count : 324751.
FLOP Count : 26141.
MOPS : 226.902166
MFLOPS : 2.683605
A. V. Length : 142.185201
V. Op. Ratio (%) : 14.692927
Memory Size (MB) : 192.031250
MIPS : 193.798070
I-Cache (sec) : 0.002054
O-Cache (sec) : 0.001399
Bank Conflict Time
CPU Port Conf. (sec) : 0.000010
Memory Network Conf. (sec) : 0.000007
Start Time (date) : Wed Nov 17 00:24:43 JST 2010
End Time (date) : Wed Nov 17 00:24:44 JST 2010
出力例(日本語):
(環境変数「setenv LANG japan」を指定)
****** プログラム情報 ******
経過時間 (秒) : 1.044924
ユーザ時間 (秒) : 0.010063
システム時間 (秒) : 0.020361
ベクトル命令実行時間 (秒) : 0.000050
全命令実行数 : 1891084.
ベクトル命令実行数 : 2284.
ベクトル命令実行要素数 : 324751.
浮動小数点データ実行要素数 : 26146.
MOPS 値 : 219.969293
MFLOPS 値 : 2.598231
平均ベクトル長 : 142.185201
ベクトル演算率 (%) : 14.671042
メモリ使用量 (MB) : 192.031250
MIPS 値 : 187.924476
命令キャッシュミス (秒) : 0.001853
オペランドキャッシュミス (秒) : 0.001798
バンクコンフリクト時間
CPU ポート競合 (秒) : 0.000008
メモリネットワーク競合 (秒) : 0.000007
開始時刻 (日付) : 2010年 11月 30日 火曜日 15:25:14 JST
終了時刻 (日付) : 2010年 11月 30日 火曜日 15:25:15 JST
2014.07.14
Users's Reference に記載されてるコマンドは存在しますので可能です。
Utility Programs http://www.gaussian.com/g_tech/g_ur/m_utils.htm
利用する場合は、バッチリクエスト用シェルスクリプト内に、Referenceに記載の方法で記述しバッチリクエストを投入してください。
例)カレントフォルダにあるwater.chkをwater.fchkに変換している(PCクラスタ)
以下の一行をバッチリクエスト用のシェルスクリプト内に記述。
${g09root}/g09/formchk water.chk water.fchk
マニュアル等を参考にお試しいただければと思います。
2014.07.14
大阪大学内であれば、貸し出し可能です。
下記までご連絡ください。
system{a}cmc.osaka-u.ac.jp