Implementation of a direct solver for large-scale spars matrices on SX-ACE
Authors:
Atsushi Suzuki
Atsushi Suzuki
Affiliation:
Cybermedia Center, Osaka University
Abstract:
大規模疎行列ソルバーは流体,弾性体などの有限要素解析における主要ツールである. マルチコアスーパースカラCPU向けに開発している, C++で記述された Dissection コードをマルチコアベクトルCPU構成のSX-ACEで稼働するよう移植することを目的とする. 共有メモリーの1ノード, 4コアを対象とし,マルチコア並列は POSIX Threads ライブラリー による非同期の並列実行により実現し, ベクトル化は直接法の主たる演算を担っているBLAS レベル3ライブラリーにベクトル化された逐次演算のものを用いる. SX-ACE は 1コアあたり64GFlop/s の演算性能を持つが, 60万次元の非圧縮性流れ問題の疎行列を用いて, 1コアあ19.2GFlop/sのIntel Xeon CPUに対し, 2.4倍, 4コアでは1.99倍の演算性能を得た. 4コアでの並列効率は65.5%である.
Publication related to your research:
(Domestic conference/wokrshop)
-
"A Direct solver of sparse matrices for fluid problems on a multicore supercomputer" A. Suzuki, The 23rd Workshop on Sustained Simulation Performance, 16-17, March, 2016,
Tohoku University, Sendai, Japan
Posted : March 31,2016