SQUID GPUノードにおけるGPU間集団通信性能の分析
氏名:高橋慧智
所属:大阪大学 D3センター
概要:SQUID GPUノードにおけるGPU間集団通信性能を明らかにすることを目的とし、OSU MicroBenchmarks (OMB) を用いてAllreduceの性能を評価した。SQUID標準のOpen MPI(BaseGPU/2024)、NVIDIA HPC SDK同梱のOpen MPI、NVIDIA NCCLを比較した結果、NCCLが全メッセージサイズで最速であった。BaseGPUモジュールのOpen MPIはNVLinkを利用できておらず、NVIDIA HPC SDKのOpen MPIとは集団通信ライブラリ(UCCやHCOLL)のリンク有無が性能差の要因と推察される。
Posted : 2025年03月31日