我是相當新的計算機科學(化學背景),但我寫的是在C.使用MPI我每次編譯我的代碼,我得到的各種錯誤,例如代碼,理解的MPI錯誤
rank 0 in job 1 cems_54844 caused collective abort of all ranks
exit status of rank 0: killed by signal 9
在過去一週裏發生過類似的錯誤,我真的可以利用一些幫助來實現某種方式來了解更多關於這個問題的信息。
以下page是關於MPI中的錯誤處理。不幸的是我對計算機科學知之甚少,無法理解這個討論。
有了這個,我希望有人願意給我一個關於處理MPI錯誤的速成課程,並且可能會在關聯討論中爲我介紹一些更多的東西(對於外行)。
我不是在問一個關於「你會爲我寫代碼」的問題,我要求提供有關如何理解MPI錯誤的概念性建議。
定義這是一個關於編程。與計算機科學無關。 – Gilles
請提供有關您正在使用的系統的信息,尤其是哪些MPI實施,應用程序,批處理系統等以及更多錯誤消息。這樣我們可以提供特定的幫助。注意:'signal 9'是[SIGKILL](https://en.wikipedia.org/wiki/Unix_signal),可能只是潛在原因的影響。 – Zulan
具體問題是http://stackoverflow.com/q/14061927/620382 – Zulan