Implementation of a direct solver for large-scale spars matrices on SX-ACE

 

Authors:
Atsushi Suzuki

Affiliation:
Cybermedia Center, Osaka University

Abstract:
大規模疎行列ソルバーは流体,弾性体などの有限要素解析における主要ツールである. マルチコアスーパースカラCPU向けに開発している, C++で記述された Dissection コードをマルチコアベクトルCPU構成のSX-ACEで稼働するよう移植することを目的とする. 共有メモリーの1ノード, 4コアを対象とし,マルチコア並列は POSIX Threads ライブラリー による非同期の並列実行により実現し, ベクトル化は直接法の主たる演算を担っているBLAS レベル3ライブラリーにベクトル化された逐次演算のものを用いる. SX-ACE は 1コアあたり64GFlop/s の演算性能を持つが, 60万次元の非圧縮性流れ問題の疎行列を用いて, 1コアあ19.2GFlop/sのIntel Xeon CPUに対し, 2.4倍, 4コアでは1.99倍の演算性能を得た. 4コアでの並列効率は65.5%である.

 

Publication related to your research:

(Domestic conference/wokrshop)

  • "A Direct solver of sparse matrices for fluid problems on a multicore supercomputer" A. Suzuki, The 23rd Workshop on Sustained Simulation Performance, 16-17, March, 2016,
    Tohoku University, Sendai, Japan

 




Posted : March 31,2016