2014.08.25

利用を終了したいのですが、どのような手続きが必要でしょうか?

利用終了には特別な手続きは必要ありません。継続申請をしなかった場合に、当年度末をもって利用終了となります。

2014.07.24

投入したジョブの計算がいつ始まるかという目安はこちらから確認することはできないのでしょうか?

以下のコマンドを実行することで、
ジョブの予約状況を確認することが可能です。

sstat

実行開始時刻が決定していると、
STT(スケジューリング状態)がASG(Assigned)となり、PlannedStartTime(実行開始予定時間)に開始時刻が表示されます。詳細は下記をご覧ください。

スケジューラコマンドについて

2014.07.14

ジョブ投入時にNo request queue specified, and no local default has been defined.というエラーが表示される

スクリプトファイルにおける、制御コードに問題がある可能性があります。
当センターのシステムでは、文字コードはUTF-8となっておりますので、パソコンからファイル転送する際は、アスキーコードで送付するか、nkf コマンドで文字コード・改行コードを変換する必要があります。

2014.07.14

ジョブがなかなかスケジューリングされません

ジョブは各利用者様の優先度に応じて、スケジューリングされますので、場合によっては待ち時間が発生することがあります。
以下のコマンドを実行することで、ジョブの予約状況を確認することが可能です。

sstat

実行開始時刻が決定していると、
STT(スケジューリング状態)がASG(Assigned)となり、PlannedStartTime(実行開始予定時間)に開始時刻が表示されます。詳細は下記をご覧ください。

スケジューラコマンドについて

あまりに長時間の待ちが発生する場合は、何らかの制限に抵触しているか、もしくはシステムに問題がある可能性があります。以下までご連絡ください。

system{at}hpc.cmc.osaka-u.ac.jp

2014.07.14

実行中のジョブが終了したことを合図に、次のジョブを自動で投入したい。 その際、実行中のjobが成功したかどうかで、投入するジョブを変えたい。

「qwait」コマンドを使用することで、実現可能です。

このコマンドは引数で与えたリクエストID(例:12345.cmc)を待ち合わせするというものです。
指定のリクエストIDのジョブが終了するとメッセージ終了と共にコマンドが終了します。

コマンドの詳細についてはポータルで公開されておりますマニュアル
「NQS利用の手引」のリファレンス編 第1章 ユーザコマンドをご参照頂けますようお願い致します。

NQSII利用の手引き(要認証)
NQSV利用の手引き
※ man qwait でもヘルプを参照できます。

qwait については下記のような使い方が可能です。

監視スクリプトをバックグラウンド実行し、スクリプト内で qwaitを実行します。
exitコード(上記のマニュアルに記載があります)で判定し、その後の動作を分岐させています。
参考にしてください。

-----------
$ qsub job1-1
Request 12345.cmc submitted to queue: Pxx.
$ (./chkjob >& log &)

----- chkjob
#!/bin/sh
while :
do
qwait 12345.cmc #リクエストIDを任意のものに変更して下さい
case $? in
0) qsub job1-2;exit;;
1) qsub job2-1;exit;;
2) qsub job3-1;exit;;
3) echo NQS error | mail xxxx@yyyy.ac.jp;exit;;#メールアドレスを任意のものに変更してください
7) continue;;
*) ;;
esac
done
------------

以上です。

2014.07.14

ジョブを実行しても、エラーメッセージに 「/var/spool/nqsII/jsv/jobfile/****/user_script: コマンドが見つかりません.」 と出力され実行されない。

このエラーの原因は基本的に以下の2つのどちらかとなります。
 

    1.先頭行の "#!" で指定されているコマンド名(通常はシェル名)の絶対パスが誤っている可能性があります。
     パスが正しいか、入力ミスが無いかをご確認ください。
     
    2.ジョブスクリプトファイルの改行コードが CRLF (Windows)になっている可能性があります。
     スクリプトファイルは、文字コードを "UTF-8"、改行コードを "LF" で作成してください。
     

改行コードがCRLFのファイルはエディタ(vi,emacsなど)で開いた際、画面下に[DOS]と表記されます。
アップロードする前の対処方法としては下記の通りです。
 

    ・文字コードや改行コードを指定できるテキストエディタを利用する。
     (秀丸エディタ[シェアウェア] や サクラエディタ 等いろいろあります)
      ※ 文字コードは "UTF-8"、改行コードは "LF" を指定
     
    ・WinSCP でファイルをアップロードする時に転送モードを"テキスト" に設定するか、
     ファイルの拡張子をテキストだと自動判別されるもの(.txt , .sh 等)にする。
     ※ この方法では文字コードには対応できません

 
またアップロード後であっても、フロントエンドノード上で以下のコマンドを実行することで、
改行コードがCRLFからLFに変換されたsample2.shが生成されます。
 

    sed 's/\r//g' sample.sh > sample2.sh

2014.07.14

FortranプログラムからC言語プログラムのサブルーチンを呼び出したい

SX用クロスコンパイラの場合、下記のようにコンパイルすることが可能です。

% sxc++ -S a.c
% sxf90 b.f90 a.s

intelコンパイラの場合、下記のようにコンパイルすることが可能です。

% icc -c a.c
% ifort b.f90 a.o

2014.07.14

I-CACHE、O-CACHEについて教えてください。

I-CACHE、O-CAHCEとは、SXにてプログラムを実行後に出力される「プログラム情報※1」内の項目の一つです。

 名称)
  I-CACHE : 命令キャッシュ(ミス)
  O-CACHE : オペランドキャッシュ(ミス)

 意味)
  スカラユニット用のキャッシュ(I-CACHE、O-CACHE 両方共)。
  「プログラム情報」ではプログラム中でベクトル化されていない、
  スカラ処理部分におけるキャッシュミス時間を表示している。

 キャッシュ構成)
  スカラマシンの有している L1 キャッシュと同等の機能。
  SX-9 の場合は32KB(256B/キャッシュライン * 64エントリ * 2way)を有している。

 チューニング方法)
  1.スカラ処理部分を可能な限りベクトル化する。ベクトル化することにより
    キャッシュミス時間は自動的に削減される。
  2.極限までベクトル化した後もキャッシュミス時間が残る場合、
    スカラマシンと同様にキャッシュのスラッシング対策を行う。
    具体的には、O-CACHE値等で 2way で追い出し(スラッシング) が
    発生しているかどうかを確認し、スラッシングが発生している場合は
    配列をずらすことでスラッシングを回避してキャッシュヒット率を高める。
    これによりキャッシュミス時間を削減する。

※1プログラム情報
  ジョブスクリプトに「setenv F_PROGINF DETAIL」を指定する事で標準エラー出力に出力

 出力例(英語):
****** Program Information ******
Real Time (sec) : 1.055745
User Time (sec) : 0.009741
Sys Time (sec) : 0.019627
Vector Time (sec) : 0.000047
Inst. Count : 1887787.
V. Inst. Count : 2284.
V. Element Count : 324751.
FLOP Count : 26141.
MOPS : 226.902166
MFLOPS : 2.683605
A. V. Length : 142.185201
V. Op. Ratio (%) : 14.692927
Memory Size (MB) : 192.031250
MIPS : 193.798070
I-Cache (sec) : 0.002054
O-Cache (sec) : 0.001399
Bank Conflict Time
CPU Port Conf. (sec) : 0.000010
Memory Network Conf. (sec) : 0.000007

Start Time (date) : Wed Nov 17 00:24:43 JST 2010
End Time (date) : Wed Nov 17 00:24:44 JST 2010

 出力例(日本語):
  (環境変数「setenv LANG japan」を指定)
****** プログラム情報 ******
経過時間 (秒) : 1.044924
ユーザ時間 (秒) : 0.010063
システム時間 (秒) : 0.020361
ベクトル命令実行時間 (秒) : 0.000050
全命令実行数 : 1891084.
ベクトル命令実行数 : 2284.
ベクトル命令実行要素数 : 324751.
浮動小数点データ実行要素数 : 26146.
MOPS 値 : 219.969293
MFLOPS 値 : 2.598231
平均ベクトル長 : 142.185201
ベクトル演算率 (%) : 14.671042
メモリ使用量 (MB) : 192.031250
MIPS 値 : 187.924476
命令キャッシュミス (秒) : 0.001853
オペランドキャッシュミス (秒) : 0.001798
バンクコンフリクト時間
CPU ポート競合 (秒) : 0.000008
メモリネットワーク競合 (秒) : 0.000007

開始時刻 (日付) : 2010年 11月 30日 火曜日 15:25:14 JST
終了時刻 (日付) : 2010年 11月 30日 火曜日 15:25:15 JST

« Previous