
本プログラムでは、お手持ちのプログラム(非商用)を本センターで預かり、大規模計算機に対する最適化および並列化を行います。最適化、並列化することにより、本センター大規模計算機システムを最大限利活用することが見込まれるプログラムを募集いたします。なお、プログラムによっては性能評価およびコンパイルオプションによる最適化のみの対応となる場合があります。予めご了承のほどよろしくお願いいたします。
ご興味・ご関心のあります方は是非ご応募ください。
募集要項
募集期間 | 11月1日(金) - 11月15日(金) →12月3日(火) AM 10:00まで延長します |
応募資格 | 本センター大規模計算機システムのユーザ |
対象プログラム数 | 若干数 (応募者多数の場合、お断りする可能性があります。) |
応募方法 | 申請書に必要事項を記入のうえ、D3センター大規模計算機システム担当(system@cmc.osaka-u.ac.jp)まで送信してください。 申請書 |
応募に当たってのご注意
- 採択された方には、チューニング支援によるご自身の研究へのインパクトについてのコメント・感想を提出いただきます。
- 過去に本プログラムで採択された方につきましては、今回の応募対象外とさせていただきます。何卒ご理解のほどよろしくお願いいたします。
本プログラムへのご感想
今回は3次元流体構造連成解析コードを対象にチューニング支援をいただきました.主に流体計算における陰解法部分のループ分割によるベクトルレジスタ枯渇の回避を行い,全体として1割程度の計算高速化を達成しました.また今回のチューニング支援で得られた知見はその他コードの高速化においても非常に有用なものでした.この場を借りて感謝申し上げます.(北海道大学 三宅様)
今回の性能チューニングプログラミングを通じて、GPUを用いたプログラムの実行速度が向上し、計算機資源をより効率的に活用できるようになりました。チューニング対象となったプログラムは、実在気体効果を取り入れた運動論方程式を用いて空間二次元問題を解析するものです。運動論方程式においては空間座標に加えて分子速度空間も離散化するため、従来の流体方程式に比べて非常に大規模な計算となります。
これまで我々は、 MPI を用いた CPU 並列化で計算効率を高めてきました。しかし近年、 GPUの高性能化が著しく、倍精度演算でも十分に活用できるようになってきました。このような状況を踏まえ、GPUを活用したさらなる高速化を目指してプログラムの改修に着手しています。
今回のチューニングではまずソースコードに対して、多重ループを GPU で処理する際に内部ループまで並列化するための提案と、MPI通信前にデータの並べ替えなどを行って通信時間を短縮するための提案をいただきました。これらを実装した結果、コア演算および通信待機時間の双方を削減でき、実行速度が大きく向上しました。
さらに、ノード内の GPU 配置やバス構成を考慮してCUDA_VISIBLE_DEVICES やUCX_NET_DEVICESなどの環境変数を適切に設定したところ、GPU間通信のレイテンシが低減し、全体で約1.3倍の高速化を達成しました。この知見は本プログラムにとどまらず、さまざまな GPUベースのシミュレーションにも応用可能であり、今後のプログラム開発と運用に大いに役立つと確信しております。
最後になりましたが、本性能チューニングプログラムをご提供くださいました大阪大学 D3センターおよび日本電気株式会社の皆様に、心より御礼申し上げます。(京都大学 宮内様)
過去の実績
過去の実績については、こちらから閲覧可能です。
開催日 :11月1日 - 12月3日で受付
講師 :D3センター
開催場所:-
種類 :チューニング支援
定員 :若干数
申込締切:12月3日AM 10:00