


チュートリアル2

問題
・チュートリアル1の結果を改善するため、jkループのunrollを行う
  -O2でコンパイル、実行する


手順
・演習3_2で行ったkループunrollのソースコードを
  mat_tune2_jk4i_org.fとして用意済み
・まずはmat_tune2_jk4i_org.f を -O2 でコンパイル、実行する
  コンパイルは comp_jk4i_org.cshを利用し、
  run_jk4i_org.cshをqsubで投入し実行する

・mat_tune2_j4k4i.f は kループunrollのままなので、
  さらに外側jループを4段unrollとなるようにソースコードを修正する
  コンパイルは comp_j4k4i.cshを利用し、
  run_j4k4i.cshをqsubで投入し実行する

・結果ファイル(tune_2_jk4i_org.o*****、tune_2_j4k4i.o*****)の性能から
  外側ループのunroll効果を確認する


性能値
                          -O2      -O1            [GFLOPS]
   mat_tune2_jk4i_org.f  1.592   1.349(演習3_2)
   mat_tune2_j4k4i.f     4.778



回答例
./answer配下を参照




