2011-04-26 9 views
0

除了MPI_ERROR_RETURN和MPI_ERRORS_ARE_FATAL之外是否還有在OpenMPI和MPICH中實現的錯誤處理程序?哪個實現更好地處理錯誤? 請提供鏈接以獲得更多相關信息。MPICH和OpenMPI中的錯誤處理程序

回答

1

不,這些是當前標準定義的唯一兩個錯誤處理程序。目前,MPI forum正在開發MPI-3,並且錯誤處理和容錯將成爲新標準的一個重要組成部分(專用於該主題的working group)。但是,在這項工作完成之前,使MPI更強大的容錯能力的唯一方法是使用較早的非標準擴展。 FT-MPI是一個開發了非常強大的MPI的項目,但不幸的是它基於MPI1.2;該標準的一個非常早期的版本。有MPICH-V,基於MPI2,但這是更基於檢查點重新啓動。

除了檢查點重啓的線路,既OpenMPIMPICH2BLCR,容錯的透明檢查點重啓的形式,可以方便地回滾到上一個檢查點的硬件或網絡故障的情況下支持。