2017-05-30 277 views
-1

在大學時,我被要求一個實驗室進行並行編程:並行化矩陣乘法。我寫了一個類似於這個例子的算法,但是這個實現提供了一個斷點。請告訴我,我能修好些什麼?矩陣乘法MPI

#define _CRT_SECURE_NO_WARNINGS 
#include <cstdlib> 
#include <iostream> 
#include <math.h> 
#include "mpi.h" 
#include <stdio.h> 
const int N=4; 
int main(int argc, char *argv[]) { 
    int r,q,myid,numprocs; 
    int i0; 
    int *b,*c,*loc_a,*loc_c; 
    MPI_Init(&argc,&argv); 
    MPI_Comm_size(MPI_COMM_WORLD,&numprocs); 
    MPI_Comm_rank(MPI_COMM_WORLD,&myid); 
    MPI_Status status; 
    q=N/numprocs; 
    b=new int [N*N]; 
    c=new int [N*N]; 
    loc_c=new int[N*N]; 
    loc_a=new int[q]; 
    for(int i=0;i<N*N;i++)  { 
     c[i]=0;  loc_c[i]=0;  
    }  
    if(myid==0)  { 
     for (int j = 0; j<numprocs; j++) { 
      for (r = 0; r<q*N; r++) { 
       loc_a[r] = 1; 
      }   
      MPI_Send(&loc_a[0], q*N, MPI_INT, j, 0, MPI_COMM_WORLD); 
     }  
     for (int i = 0; i<N*N; i++) { 
      b[i] = 1; 
     }   
    }  
    MPI_Recv(&loc_a[0], q*N, MPI_INT, 0, 0, MPI_COMM_WORLD, &status); 
    for (r = 0; r<N; r++) { 
     MPI_Bcast(&b[r*N], N, MPI_INT, 0, MPI_COMM_WORLD); 
     i0 = myid*q; 
     for (int i = 0; i<q; i++) { 
      for (int j = 0; j<N; j++) { 
       loc_c[r*N + i0] += loc_a[i*N + j] * b[r*N + j]; 
      }  
      i0++; 
     }  
     MPI_Reduce(loc_c, c, N*N, MPI_INT, MPI_SUM, 0, MPI_COMM_WORLD); 
    }  
    if (myid == 0) { 
     FILE *f = fopen("result.txt", "w"); 
     for (int i = 0; i<N; i++) { 
      for (int j = 0; j<N; j++) { 
       fprintf(f, "%d\t", c[j*N + i]); 
      }  
      fprintf(f, "\n"); 
     }  
     fclose(f); 
    } 
return 0; 
MPI_Finalize(); 
} 
+1

調試代碼,至少告訴我們行 – Netwave

+0

工作中止: [隊伍]消息 [0]致命錯誤 在MPI_SEND致命錯誤:其他MPI錯誤,錯誤堆棧: MPI_SEND(BUF = 0x00277FE8,計數= 16,MPI_INT,DEST = 0,標記= 0,MPI_COMM_WORLD)失敗 DEADLOCK:試圖發送給本地過程的信息沒有事先匹配接收 –

回答

1

你得到該錯誤消息似乎非常簡單:

要調用本身作爲目標(myid == 0j == 0)而不調用無阻塞第一RECV,這意味着你的進程上的進程阻塞MPI_SEND在繼續之前將無限等待自己接收消息,導致死鎖。

你有多種選擇這裏,這取決於你的目標:

  1. 通話無阻塞的recv第一

  2. 不使用MPI_SEND發送到它本身(檢查是否my_id == j和不發如果爲true)

+0

感謝您的有用答案,第一選擇正在工作。 –