


チュートリアル1

問題
・3重ループの並びを入れ替え、それぞれの性能を確認する
  -O1でコンパイル、実行する


手順
・元のソースコードはmat_tune1_jki.f
・mat_tune1_ijk.fとmat_tune1_kji.fは
  jkiループとなっているので、それぞれijkとkjiとなるように
  ループを入れ替える

・comp.csh で3ファイルまとめてコンパイルできる
  シェル内で-O1を設定済み

・run.csh を qsub で投入し実行する

・結果ファイル(tune_1.o*****)の性能から
  ループの並びによる配列のアクセスパターンと性能はどのようになっているか
  最内ループをなるべく連続アクセスとするパターンが速い = 高速化の基本


性能値
                     -O1   [GFLOPS]
   mat_tune1_jki.f   0.853  
   mat_tune1_ijk.f   0.172
   mat_tune1_kji.f   0.723 



回答例
./answer配下を参照




