我希望有人能幫助我。我的代碼:MPI中意外的死鎖
void process(int myid, int numprocs)
{
int i,j, anzahl, rest;
MPI_Status stat;
meta = (int *)malloc(3 * sizeof(int));
if(myid == 0)
{
meta[0] = ASpalten;
meta[1] = AZeilen;
meta[2] = BSpalten;
for (i = 0; i < numprocs; i++) //masternode distributes matrix A to every single core
{
MPI_Send(&meta[0], 3, MPI_INT, i, TAG, MPI_COMM_WORLD);
printf("%d: debug04\n", myid);
MPI_Send(&MA[0], ASpalten*AZeilen, MPI_DOUBLE, i, TAG, MPI_COMM_WORLD);
printf("%d: debug05\n", myid);
MPI_Send(&MB[0], ASpalten*BSpalten, MPI_DOUBLE, i, TAG, MPI_COMM_WORLD);
printf("%d: debug06\n", myid);
}
}
else
{
MPI_Recv(meta, 3, MPI_INT, 0, TAG, MPI_COMM_WORLD, &stat);
printf("%d: debug01\n", myid);
ASpalten = meta[0];
AZeilen = meta[1];
BSpalten=meta[2];
printf("%d: debug02\n", myid);
MA = (double*)malloc(ASpalten*AZeilen*sizeof(double));
MB = (double*)malloc(ASpalten*BSpalten*sizeof(double));
MR = (double*)malloc(AZeilen*BSpalten*sizeof(double));
MPI_Recv(MA, ASpalten*AZeilen, MPI_DOUBLE, 0, TAG, MPI_COMM_WORLD, &stat);
MPI_Recv(MB, ASpalten*BSpalten, MPI_DOUBLE, 0, TAG, MPI_COMM_WORLD, &stat);
printf("%d: debug03\n", myid);
// printf("%d: %f\n", myid, *(MA + _index(1, 1, ASpalten))); //funktioniert
}
的數據類型:
int ASpalten;
int AZeilen;
int BSpalten;
int *meta; //used to transfer meta data in 1 send
double *MA; //Matrix A
double *MB; //Matrix B
程序應該乘使用MPI 2點矩陣。我的樣本矩陣證明代碼可能是有效的,我也可以運行這個代碼(最多可能更少),但無論如何,隨着數量的增加,我遇到了一個可能的死鎖:控制檯打印出來"debug4"
就是這樣。我會非常感激,如果有人知道我的計劃中出了什麼問題。我已經嘗試使用MPI_INTEGER
而不是MPI_INT
,但沒有任何區別。任何幫助,將不勝感激。控制檯的使用非常小的矩陣時,輸出(PS,我已經嘗試執行我以不同的順序也測試用例和修改現有的):
Testcase1 MPI:
0:debug04
0:debug05
0:debug06
0:debug04
1:debug01
1:debug02
0:debug05
1:debug03
1:debugx1
0:debug06
0:debug04 ......
難道這些定義的任何地方? 'int ASpalten,AZeilen,BSpalten;' –
您是否考慮過使用'MPI_Bcast'? –