2015.02.26

SX実行時エラーメッセージに表示されるELN 情報の見方が分からない

ELN情報には、サブルーチン内の問題箇所の行番号が出力されます。
プリプロセッサを動作させている場合は、中間ファイルの行番号がELNとして出力されますのでご注意下さい。
 

行番号のずれについて

SXのハードウェアは高度な先行処理を行っており、
プログラムの実行時に例外が発生してから実際に検出されるまでの
ごくわずかな時間にも先行して命令を処理しています。
 
これが原因で、プログラム例外を発生した命令と実際に検出した命令がずれ、行番号の対応が取れないことがあります。このずれはコンパイラが命令の並び替えなどの最適化を行っていると、さらに大きくずれ実際のソースでは何十行とずれた行になることもあります。
 
このため、例外が発生した行番号を正確に表示するには、ハードウェアの
先行制御を抑止してプログラムを実行する必要があります。
 
FORTRAN90/SX では -adv詳細オプションを用意しており、このオプションを
指定することでハードウェアの先行制御をコントロールすることができます。
 

-adv
演算プロセッサ(AP)における先行制御の状態を変更することを指定する。
すなわち、先行制御機能をプログラム単位の入口で設定し、出口で回復することを指定する。

-adv on  プログラム単位の入口で動作状態にし、出口で回復することを指定する。
-adv off  プログラム単位の入口で停止状態にし、出口で回復することを指定する。

 

例えば、ある手続きに対してハードウェアの先行制御を抑止したい場合は
-adv off を指定してください。
 
ただし、本オプションを指定した場合、著しくプログラムの実行性能が
低下します(実行時間が10倍あるいはそれ以上にもなることがあります)。
このため、ご使用される場合は、むやみに指定するのではなく、先行制御を
抑止して実行する区間が可能な限り短くなるようにしてください。
 
また、コンパイラの行う最適化によって発生しないはずの例外が発生したり、
あるいは発生する例外の位置や回数が変わったりもしますので、この点にも
ご注意ください。「FORTRAN90/SX プログラミングの手引」
「4.4 最適化機能を使用する場合の注意」を参照ください。


 
SXのエラーメッセージについては、下記にマニュアルをご用意しておりますので、まずご確認いただけますと幸いです。
 

閲覧には利用者番号での認証が必要となりますので、ご注意ください。
FORTRAN90/SX プログラミングの手引
 
こちらの「付録D 実行時のメッセージ」「D.1.1 エラーメッセージの形式」という個所をご確認ください。
 

2015.02.13

ssh接続は可能だが、sftp/scpでの接続ができない

「.cshrc」ファイルで、他のシェルを起動していないかご確認ください。
sftp-serverはcshから起動を行いますので、他のシェルを起動しているとsftp-serverが起動できずtimeoutとなります。「.cshrc」ファイルから、他シェル起動の処理を削除の上、再度お試しください。
 
解決しない場合は、お手数かと思いますが、下記よりご連絡ください。
お問い合わせフォーム

2015.02.12

計算機はどのように利用するのでしょうか?

全ての計算機に共通する利用方法を下記で解説しておりますので、ご参照ください。

基本的な利用方法

2015.02.12

コンパイラについて教えてください

コンパイラは計算機資源毎で異なっております。
詳細については、下記をご覧くださいませ。
SQUIDの利用方法 OCTOPUSの利用方法

2015.02.12

出力されるエラーメッセージについて、どのマニュアルを参照すればよいでしょうか?

各コンパイラのマニュアルをご参照ください。
マニュアルは下記に置いております。閲覧いただく場合、利用者番号での認証が必要となります。

利用マニュアル

2015.02.12

サンプルプログラム等はありますか?

各利用方法のページをご参照ください。
SQUIDの利用方法 OCTOPUSの利用方法

2015.02.10

ログインパスワードを忘れました。どうしたらよいでしょうか?

以下のサイトの「パスワード初期化申請をする」ボタンより申請ください。

Web利用申請システム

2015.02.10

計算中にリアルタイムで結果が出力されない

(質問の補足)

    計算機で下記のような処理を行ったとします。
    ./a.out > output.txt
    a.outの実行結果はoutput.txtに書き込まれるのですが、計算中にoutput.txtを確認しても、出力結果が反映されるのが非常に遅いのではないか、という質問です。

 
(回答)
データ書き込みは、下記のような仕組みで行っています。
それぞれバッファやキャッシュに溜め込む形で、書き出し処理を行っているため、フロントエンドでファイルが確認できるまで時間を要します。
 

    1. FORTRAN側の動作

    プログラムからの print 実行時、F_SETBUF の設定により、ファイルへのwrite 発行契機が変わります。

      - 環境変数F_SETBUFが未設定の場合は、wsize のサイズ分だけバッファされたのち、writeが発行されます
      - F_SETBUF=0 設定した場合は、print毎でwriteを発行します

 

    2. ファイルシステム側の動作

    write が発行されると、データキャッシュに writeデータを書き込みます。データキャッシュ内のデータは、下記を契機に IOサーバへデータを送信します。

      - プログラムでデータのフラッシュを実行した場合(ex. FORTRANの call flush(6) / Cの fsync(2))
      - ファイルをクローズした場合
      - データキャッシュが一杯になった場合

 
「1. FORTRAN側の動作」による影響は小さいと予想されるため、時間がかかる原因としては主に「2. ファイルシステム側の動作」のデータキャッシュサイズによるものです。
 
リアルタイムに近い出力を希望される場合、FORTRANプログラム内にて、print実行後に、call flush(6) を実行し、標準出力への内容をフラッシュしていただく必要があります。
これにより、flush実行毎にリダイレクト先ファイルへ反映されます。
※当センターのファイルシステムは、ScateFS(Scalable Technology File System)という独自のファイルシステムを搭載しております。「2.ファイルシステム側の動作」の挙動はScateFSの仕様によるものです。
※sxf03コンパイラは対応していません。
 

関連するFAQ
SX-ACEの標準出力で、MPIの計算結果をリアルタイムに確認したい

2015.02.10

スーパーコンピューターの接続方法を教えてください

接続方法はこちらをご覧ください。
ログイン方法
 
HPCIやJHPCN-HPCIシステムで利用する場合は、こちらをご覧ください。
ログイン方法(HPCI利用者向け)

2015.02.10

利用申込を行いたいのですが、どうしたらよいでしょうか。

利用申し込みについては下記をご参照ください。
新規利用申請

2015.02.10

センターでは、どんなコンピュータが使えますか?

当センターで提供しております大規模計算機システムの紹介に掲載しております。ご覧くださいませ。

システム紹介

2015.02.10

スーパーコンピューターシステムを利用するための利用目的、資格等に制限がありますか。

当センターで提供しております大規模計算機システムの利用資格、利用規定を下記に掲載しております。ご覧くださいませ。

利用資格と利用規定

2015.02.10

ジョブスクリプトで指定した環境変数やオプションが読み込まれない

環境変数やオプションはsetenvも設定できますが、マルチノードでジョブを実行した場合は、
スレーブノードにsetenvで指定した環境変数が設定されません。
マルチノードでジョブを実行する場合は、NQSIIの-vオプションをご利用ください。

#PBS -v [環境変数orオプション]=[設定内容]

のように指定します。

2014.12.18

過去のチューニング事例を教えてください

過去に、(株)日本電気と本センターが協力してチューニングした事例をご紹介いたします。
なお、利用者番号での認証が必要となっておりますので、ご了承ください。

2009年度チューニング報告
2013年度チューニング報告

2014.12.17

フロントエンドでAVS/Expressを起動しようとするとエラーが表示されます

いくつかの原因が考えられますので、まずエラーメッセージをご確認ください。
 
 

Xサーバ環境が整っていない場合

下記のようなエラーメッセージが表示されます(あくまで一例です)

サーバはこのマシンに転送を試みました。
localhost上のXサーバへの接続を要求しました(ディスプレイ0:0)。
接続は拒否されました(おそらくサービス停止中です)。
転送接続を終了します。

フロントエンドでAVS/Expressをご利用いただく場合、Xサーバ環境を必須となります。
まず下記をご参照いただき、Xサーバ環境の設定をご確認ください。
可視化ソフトウェア AVS/Express Xサーバ環境のアプリケーションを利用する方法
 

ライセンスが不足している場合

下記のようなエラーメッセージが表示されます。


Could not get license from server: license limit exceeded
Found and opened license file: /sc/cmc/apl/AVS/v8.2/express82/license.dat
Product name does not match: LICSERV != EXPRESS
Use-limited licenses must be obtained from a license server
Failed to find a valid license.

AVS/Expressは同時利用いただけるライセンス数には限りがございます。
他の人が利用している間は、利用できません。
しばらくしてからもう一度お試しください。
解決しない場合、system{a}cmc.osaka-u.ac.jpまでご連絡ください。
 

上記に該当しない場合

システムに問題がある可能性があります。
system{a}cmc.osaka-u.ac.jpまでご連絡ください。

 

2014.12.11

SX-ACE用にコンパイルしたプログラムをSX-Aurora TSUBASA(SQUIDベクトルノード群)で実行することは可能ですか?

基本的に、再コンパイルが必要となります。移行手順は以下をご参照ください。
SX-ACEからSX-Aurora TSUBASAへの移行の流れ

2014.12.10

グループのディスクの使用状況を確認する方法を教えてください

ディスク使用状況を確認するコマンドを提供しております。
下記をご覧ください
利用状況の確認方法

2014.08.25

利用を終了したいのですが、どのような手続きが必要でしょうか?

利用終了には特別な手続きは必要ありません。継続申請をしなかった場合に、当年度末をもって利用終了となります。

2014.07.24

投入したジョブの計算がいつ始まるかという目安はこちらから確認することはできないのでしょうか?

以下のコマンドを実行することで、
ジョブの予約状況を確認することが可能です。

sstat

実行開始時刻が決定していると、
STT(スケジューリング状態)がASG(Assigned)となり、PlannedStartTime(実行開始予定時間)に開始時刻が表示されます。詳細は下記をご覧ください。

スケジューラコマンドについて

2014.07.14

Gaussian09の利用を検討しています。 自分で所有しているPCクラスタマシンで利用する場合、クラスタを構成している全てのコンピュータに関して申請を行う必要があるでしょうか。

基本的にはインストールマシン全ての情報を送付いただく必要があります。
ただ、1台につき1枚の申請書というわけでは無いので、まとめて記載し提出いただいても結構です。

2014.07.14

ジョブ投入時にNo request queue specified, and no local default has been defined.というエラーが表示される

スクリプトファイルにおける、制御コードに問題がある可能性があります。
当センターのシステムでは、文字コードはUTF-8となっておりますので、パソコンからファイル転送する際は、アスキーコードで送付するか、nkf コマンドで文字コード・改行コードを変換する必要があります。

2014.07.14

ジョブがなかなかスケジューリングされません

ジョブは各利用者様の優先度に応じて、スケジューリングされますので、場合によっては待ち時間が発生することがあります。
以下のコマンドを実行することで、ジョブの予約状況を確認することが可能です。

sstat

実行開始時刻が決定していると、
STT(スケジューリング状態)がASG(Assigned)となり、PlannedStartTime(実行開始予定時間)に開始時刻が表示されます。詳細は下記をご覧ください。

スケジューラコマンドについて

あまりに長時間の待ちが発生する場合は、何らかの制限に抵触しているか、もしくはシステムに問題がある可能性があります。以下までご連絡ください。

system{at}hpc.cmc.osaka-u.ac.jp

2014.07.14

実行中のジョブが終了したことを合図に、次のジョブを自動で投入したい。 その際、実行中のjobが成功したかどうかで、投入するジョブを変えたい。

「qwait」コマンドを使用することで、実現可能です。

このコマンドは引数で与えたリクエストID(例:12345.cmc)を待ち合わせするというものです。
指定のリクエストIDのジョブが終了するとメッセージ終了と共にコマンドが終了します。

コマンドの詳細についてはポータルで公開されておりますマニュアル
「NQS利用の手引」のリファレンス編 第1章 ユーザコマンドをご参照頂けますようお願い致します。

NQSII利用の手引き(要認証)
NQSV利用の手引き
※ man qwait でもヘルプを参照できます。

qwait については下記のような使い方が可能です。

監視スクリプトをバックグラウンド実行し、スクリプト内で qwaitを実行します。
exitコード(上記のマニュアルに記載があります)で判定し、その後の動作を分岐させています。
参考にしてください。

-----------
$ qsub job1-1
Request 12345.cmc submitted to queue: Pxx.
$ (./chkjob >& log &)

----- chkjob
#!/bin/sh
while :
do
qwait 12345.cmc #リクエストIDを任意のものに変更して下さい
case $? in
0) qsub job1-2;exit;;
1) qsub job2-1;exit;;
2) qsub job3-1;exit;;
3) echo NQS error | mail xxxx@yyyy.ac.jp;exit;;#メールアドレスを任意のものに変更してください
7) continue;;
*) ;;
esac
done
------------

以上です。

2014.07.14

ジョブを実行しても、エラーメッセージに 「/var/spool/nqsII/jsv/jobfile/****/user_script: コマンドが見つかりません.」 と出力され実行されない。

このエラーの原因は基本的に以下の2つのどちらかとなります。
 

    1.先頭行の "#!" で指定されているコマンド名(通常はシェル名)の絶対パスが誤っている可能性があります。
     パスが正しいか、入力ミスが無いかをご確認ください。
     
    2.ジョブスクリプトファイルの改行コードが CRLF (Windows)になっている可能性があります。
     スクリプトファイルは、文字コードを "UTF-8"、改行コードを "LF" で作成してください。
     

改行コードがCRLFのファイルはエディタ(vi,emacsなど)で開いた際、画面下に[DOS]と表記されます。
アップロードする前の対処方法としては下記の通りです。
 

    ・文字コードや改行コードを指定できるテキストエディタを利用する。
     (秀丸エディタ[シェアウェア] や サクラエディタ 等いろいろあります)
      ※ 文字コードは "UTF-8"、改行コードは "LF" を指定
     
    ・WinSCP でファイルをアップロードする時に転送モードを"テキスト" に設定するか、
     ファイルの拡張子をテキストだと自動判別されるもの(.txt , .sh 等)にする。
     ※ この方法では文字コードには対応できません

 
またアップロード後であっても、フロントエンドノード上で以下のコマンドを実行することで、
改行コードがCRLFからLFに変換されたsample2.shが生成されます。
 

    sed 's/\r//g' sample.sh > sample2.sh

2014.07.14

FortranプログラムからC言語プログラムのサブルーチンを呼び出したい

SX用クロスコンパイラの場合、下記のようにコンパイルすることが可能です。

% sxc++ -S a.c
% sxf90 b.f90 a.s

intelコンパイラの場合、下記のようにコンパイルすることが可能です。

% icc -c a.c
% ifort b.f90 a.o

2014.07.14

I-CACHE、O-CACHEについて教えてください。

I-CACHE、O-CAHCEとは、SXにてプログラムを実行後に出力される「プログラム情報※1」内の項目の一つです。

 名称)
  I-CACHE : 命令キャッシュ(ミス)
  O-CACHE : オペランドキャッシュ(ミス)

 意味)
  スカラユニット用のキャッシュ(I-CACHE、O-CACHE 両方共)。
  「プログラム情報」ではプログラム中でベクトル化されていない、
  スカラ処理部分におけるキャッシュミス時間を表示している。

 キャッシュ構成)
  スカラマシンの有している L1 キャッシュと同等の機能。
  SX-9 の場合は32KB(256B/キャッシュライン * 64エントリ * 2way)を有している。

 チューニング方法)
  1.スカラ処理部分を可能な限りベクトル化する。ベクトル化することにより
    キャッシュミス時間は自動的に削減される。
  2.極限までベクトル化した後もキャッシュミス時間が残る場合、
    スカラマシンと同様にキャッシュのスラッシング対策を行う。
    具体的には、O-CACHE値等で 2way で追い出し(スラッシング) が
    発生しているかどうかを確認し、スラッシングが発生している場合は
    配列をずらすことでスラッシングを回避してキャッシュヒット率を高める。
    これによりキャッシュミス時間を削減する。

※1プログラム情報
  ジョブスクリプトに「setenv F_PROGINF DETAIL」を指定する事で標準エラー出力に出力

 出力例(英語):
****** Program Information ******
Real Time (sec) : 1.055745
User Time (sec) : 0.009741
Sys Time (sec) : 0.019627
Vector Time (sec) : 0.000047
Inst. Count : 1887787.
V. Inst. Count : 2284.
V. Element Count : 324751.
FLOP Count : 26141.
MOPS : 226.902166
MFLOPS : 2.683605
A. V. Length : 142.185201
V. Op. Ratio (%) : 14.692927
Memory Size (MB) : 192.031250
MIPS : 193.798070
I-Cache (sec) : 0.002054
O-Cache (sec) : 0.001399
Bank Conflict Time
CPU Port Conf. (sec) : 0.000010
Memory Network Conf. (sec) : 0.000007

Start Time (date) : Wed Nov 17 00:24:43 JST 2010
End Time (date) : Wed Nov 17 00:24:44 JST 2010

 出力例(日本語):
  (環境変数「setenv LANG japan」を指定)
****** プログラム情報 ******
経過時間 (秒) : 1.044924
ユーザ時間 (秒) : 0.010063
システム時間 (秒) : 0.020361
ベクトル命令実行時間 (秒) : 0.000050
全命令実行数 : 1891084.
ベクトル命令実行数 : 2284.
ベクトル命令実行要素数 : 324751.
浮動小数点データ実行要素数 : 26146.
MOPS 値 : 219.969293
MFLOPS 値 : 2.598231
平均ベクトル長 : 142.185201
ベクトル演算率 (%) : 14.671042
メモリ使用量 (MB) : 192.031250
MIPS 値 : 187.924476
命令キャッシュミス (秒) : 0.001853
オペランドキャッシュミス (秒) : 0.001798
バンクコンフリクト時間
CPU ポート競合 (秒) : 0.000008
メモリネットワーク競合 (秒) : 0.000007

開始時刻 (日付) : 2010年 11月 30日 火曜日 15:25:14 JST
終了時刻 (日付) : 2010年 11月 30日 火曜日 15:25:15 JST

2014.07.14

Gaussianで、Formchkユーティリティを使いたい。どのようなバッチリクエストを記述すればよいでしょうか?

Users's Reference に記載されてるコマンドは存在しますので可能です。
Utility Programs http://www.gaussian.com/g_tech/g_ur/m_utils.htm
利用する場合は、バッチリクエスト用シェルスクリプト内に、Referenceに記載の方法で記述しバッチリクエストを投入してください。

例)カレントフォルダにあるwater.chkをwater.fchkに変換している(PCクラスタ)
  以下の一行をバッチリクエスト用のシェルスクリプト内に記述。
 ${g09root}/g09/formchk water.chk water.fchk

マニュアル等を参考にお試しいただければと思います。

2014.07.14

Gaussianのマニュアルを借りることはできますか?

大阪大学内であれば、貸し出し可能です。
下記までご連絡ください。

system{a}cmc.osaka-u.ac.jp

« Previous