我想並行化一個100個節點的分佈式內存集羣中的C串行代碼。該集羣由25個刀片組成,每個刀片有四個核心,每個都由infiniband組成。在我使用PBS在不同節點之間傳播程序的幾個串行運行之前。現在我想知道:分佈式內存集羣的OpenMP或MPI或OpenMPI?
- 什麼是在這種情況下OpenMP或MPI或OpenMPI的最佳選擇(目前我不想嘗試混合的方法,因爲我開始學習)?
- 我在哪裏可以找到示例/教程?
- 對於一個簡單的帶有for循環的串行代碼,OpenMP/MPI/OpemMPI總是比像PBS這樣的排隊方法執行得更好嗎?
英特爾將OpenMP移植到其「Cluster OpenMP」項目中的分佈式內存中(現在已放棄)。主頁:https://software.intel.com/en-us/articles/cluster-openmp-for-intel-compilers,論文「將OpenMP擴展到羣集」:http://assets.devx.com/goparallel/19403 .pdf HPCWire:http://www.hpcwire.com/2006/05/19/openmp_on_clusters-1/和基準測試[「英特爾集羣OpenMP的最初經驗」](http://citeseerx.ist.psu.edu/viewdoc /download?doi=10.1.1.87.8887&rep=rep1&type=pdf#page=61) – osgx 2014-05-01 02:49:49