2017-03-09 83 views
-1

我嘗試在Mac OS Sierra上運行此代碼,並始終出現分段錯誤11錯誤。我最近開始學習Mpi和C.分段錯誤:11 Mpi Mac OS

#include <stdio.h> 
#include <stdlib.h> 
#include <string.h> 
#include <mpi.h> 
void merge_sort(int l,int r,int part[]){ 
if (!(l<r)) return ; 
int m = l + (r - l)/2; 
merge_sort(l,m,part); 
merge_sort(m+1,r,part); 

int i = l, j = m+1, k = 0; 
int a[10000]; 

while (i<=m && j<=r) { 
    if (part[i]>part[j]) {a[k] = part[j];j++;} 
    else {a[k] = part[i];i++;} 
    k++; 
} 
while (i<=m) {a[k] = part[i];i++;k++;} 
while (j<=r) {a[k] = part[j];j++;k++;} 

for (i=0;i<k;i++) part[i+l] = a[i]; 

} 
int read(int size,int rank,int part[]){ 
int local_sz=0; 
int n; 
int data[1000000]; 
if (rank==0){ 
    FILE *f = fopen("numbers.txt","r"); 
    fscanf(f,"%d",&n); 
    int i; 
    for (i=0;i<n;i++)fscanf(f,"%d",&data[i]); 
    local_sz = n/size; 
} 

MPI_Bcast(&local_sz,1,MPI_INT,0,MPI_COMM_WORLD); 

MPI_Scatter(data,local_sz,MPI_INT,part,local_sz,MPI_INT,0,MPI_COMM_WORLD); 

return local_sz; 
} 
int main(int argc,char* argv[]){ 
int comm_sz,my_rank,local_sz; 
int part[10000]; 
int *other_part[10000]; 
int i,j; 
MPI_Init(&argc,&argv); 
MPI_Comm_size(MPI_COMM_WORLD,&comm_sz); 
MPI_Comm_rank(MPI_COMM_WORLD,&my_rank); 
printf("yess\n"); 
local_sz=read(comm_sz,my_rank,part); 

merge_sort(0,local_sz-1,part); 


for (i=0;i<local_sz;i++) 
    printf("%d ", *(part+i)); 
printf("\n"); 
for (i=0;i<comm_sz;i++){ 
    if (i%2 == 0){ 
     if (my_rank % 2 == 0){ 
      if(my_rank+1<comm_sz){ 
       MPI_Recv(other_part,local_sz,MPI_INT,my_rank+1,0,MPI_COMM_WORLD,MPI_STATUS_IGNORE); 
       int b[local_sz*2]; 
       for (j = 0; j < local_sz; j++){ 
        b[j]=part[j]; 
        b[j+local_sz]=other_part[j]; 
       } 
       merge_sort(0,local_sz*2-1,b); 
       for (j = 0; j < local_sz; j++){ 
        part[j] = b[j]; 
        other_part[j] = b[j+local_sz]; 
       } 
       free(b); 
       MPI_Send(other_part,local_sz,MPI_INT,my_rank+1,0,MPI_COMM_WORLD); 
      } 
     } 
     else{ 
      if(my_rank-1 >= 0){ 
       MPI_Send(part,local_sz,MPI_INT,my_rank-1,0,MPI_COMM_WORLD); 
       MPI_Recv(part,local_sz,MPI_INT,my_rank-1,0,MPI_COMM_WORLD,MPI_STATUS_IGNORE); 
      } 
     } 
    } 
    else { 
     if (my_rank % 2 == 1){ 

      if(my_rank+1<comm_sz){ 
       MPI_Recv(other_part,local_sz,MPI_INT,my_rank+1,0,MPI_COMM_WORLD,MPI_STATUS_IGNORE); 
       int b[local_sz*2]; 
       for (j = 0; j < local_sz; j++){ 
        b[j]=part[j]; 
        b[j+local_sz]=other_part[j]; 
       } 
       merge_sort(0,local_sz*2-1,b); 
       for (j = 0; j < local_sz*2; j++)printf("%d ", b[j]); 
        printf("\n"); 
       for (j = 0; j < local_sz; j++){ 
        part[j] = b[j]; 
        other_part[j] = b[j+local_sz]; 
       } 
       free(b); 
       MPI_Send(other_part,local_sz,MPI_INT,my_rank+1,0,MPI_COMM_WORLD); 
      } 
     } 
     else { 

      if(my_rank-1>=0){ 
        MPI_Send(part,local_sz,MPI_INT,my_rank-1,0,MPI_COMM_WORLD); 
        MPI_Recv(part,local_sz,MPI_INT,my_rank-1,0,MPI_COMM_WORLD,MPI_STATUS_IGNORE); 
      } 
     } 
    } 
} 
FILE *file; 
char name[100]="",t[2]; 
t[0] = ((char)my_rank+48); 
t[1] = '\0'; 
strcat(name,"sorted"); 
strcat(name,t); 
strcat(name,".txt"); 
file = fopen(name,"w"); 
fprintf(file,"Process %d: ", my_rank); 
for (i=0;i<local_sz;i++)fprintf(file, "%d ", part[i]); 

MPI_Finalize(); 

return 0; 
} 

我不是很熟悉C,它很可能是,我用malloc和/或地址和指針錯誤,因此它可能是簡單的東西。

對不起,我認爲最好是提供所有的代碼,以便進行適當的調試。

+0

執行此操作:逐步刪除部分代碼,直到您沒有任何分段錯誤,並且您可能會找到它的原因。 – nbro

+0

學習調試器會更有效。然而,你需要做什麼@nbro建議用[mcve]產生適當的問題。 – Zulan

回答

0

這裏的原因是缺少numbers.txt文件。

請務必在您的代碼所在的導演內部創建一些輸入文件「numbers.txt」。

例如,把這樣的事情:

> cat numbers.txt 
1 
2 
3 
4 
5 
6 
7 
8 

您numbers.txt內。之後。開始了。結果在這裏。

> ./sample 
yess 
2 

一般來說,這是一個你從其他人那裏熟悉調試器的好建議。我會幫你的。看看這裏:

run 
Process 2641 launched: '.../tmp/sample' (x86_64) 
yess 
Process 2641 stopped 
* thread #1: tid = 0x144bc, 0x00007fffb89ff6a0 libsystem_c.dylib`flockfile + 4, queue = 'com.apple.main-thread', stop reason = EXC_BAD_ACCESS (code=1, address=0x68) 
    frame #0: 0x00007fffb89ff6a0 libsystem_c.dylib`flockfile + 4 
libsystem_c.dylib`flockfile: 
-> 0x7fffb89ff6a0 <+4>: movq 0x68(%rdi), %rdi 
    0x7fffb89ff6a4 <+8>: addq $0x8, %rdi 
    0x7fffb89ff6a8 <+12>: popq %rbp 
    0x7fffb89ff6a9 <+13>: jmp 0x7fffb8a4898e   ; symbol stub for: pthread_mutex_lock 
(lldb) bt 
* thread #1: tid = 0x144bc, 0x00007fffb89ff6a0 libsystem_c.dylib`flockfile + 4, queue = 'com.apple.main-thread', stop reason = EXC_BAD_ACCESS (code=1, address=0x68) 
    * frame #0: 0x00007fffb89ff6a0 libsystem_c.dylib`flockfile + 4 
    frame #1: 0x00007fffb8a019d0 libsystem_c.dylib`fscanf + 156 
    frame #2: 0x0000000100001399 sample`read(size=1, rank=0, part=0x00007fff5fbf5d80) + 121 at sample.c:31 
    frame #3: 0x00000001000015a3 sample`main(argc=1, argv=0x00007fff5fbff9f0) + 179 at sample.c:52 
    frame #4: 0x00007fffb898d255 libdyld.dylib`start + 1 

由於內部調試器中運行代碼,你可以輕鬆地掌握地方,什麼是錯的 - >您嘗試從文件中讀取數據sample.c文件第31行。

所以,堅韌而開始學習如何用gdb/LLDB調試代碼;)

玩得開心!