我嘗試使用混合MPI-OpenMP並行運行代碼。據我所知,只要OpenMP線程的數量少於物理處理器的數量,每個處理器就運行一個線程。假設這是真的,假設我有一個由兩個計算卡組成的假想計算節點。每塊計算卡都有4個處理器+內存的芯片。我的問題是:什麼是MPI和OpenMP參數的最佳選擇。我會說2個MPI工作和4個線程,這是正確的嗎?運行混合MPI的最佳方式 - OpenMP作業
OMP_NUM_THREADS = 4 mpirun -np 2 code
我一些同事說,這些參數應慎重選擇聽到,以獲得最佳的性能(取決於硬件佈局)。我希望在運行混合作業方面提供一些建議。
感謝