我在程序集x86中實現了一個函數,用於從C程序調用來添加浮點數組。函數的第一個參數是指向數組的指針,第二個參數是元素的數量。當我在linux中運行代碼時,出現了分段錯誤。我做錯了什麼?程序集中浮點數的總和
.text
.globl floatsum
floatsum:
push %ebp
movl %esp, %ebp
movl 8(%ebp), %eax
movl 12(%ebp), %edx
shrl $2, %edx
xorps %xmm0, %xmm0
loop:
testl %edx, %edx
je end
movaps (%eax), %xmm1
addps %xmm1, %xmm0
addl $16, %eax
decl %edx
jmp loop
end:
# 3 2 1 0
movaps %xmm0, %xmm1 # xmm0: w z y x
# xmm1: z w x y
shufps $0xb1, %xmm1, %xmm1 # 10 11 00 01 = 0xb1
addps %xmm1, %xmm0 # xmm0: w+z z+w y+x x+y
movaps %xmm0, %xmm1 # xmm1: w+z z+w y+x x+y
# xmm1: x+y y+x z+w w+z
shufps $0x1b, %xmm1, %xmm1 # 00 01 10 11 = 0x1b
addps %xmm1, %xmm0 # xmm0: w+z+x+y z+w+y+x y+x+z+w x+y+w+z
#
#movd %xmm0, %eax
#pushl %eax
finst:
flds (%esp)
popl %eax
movl %ebp, %esp
popl %ebp
ret
// C代碼
#include <stdio.h>
#include <stdlib.h>
float
floatsum(float *array, size_t number_of_items);
float
floatsum_c(float *array, size_t number_of_items){
float sum;
size_t i;
sum=0.0;
for(i=0; i<number_of_items;i++){
sum+=array[i];
}
return sum;
}
float *
create_array(size_t number_of_items){
float *array;
size_t i;
array=calloc(number_of_items, sizeof(float));
if(array){
for(i=0; i<number_of_items; i++){
array[i]=1.0+(float)i;
}
}
return array;
}
int
main(int argc, char **argv){
float *a;
float result;
size_t number_of_items, i;
number_of_items=8;
a=create_array(number_of_items);
if(a){
result=floatsum_c(a, number_of_items);
printf("Sum (c version): %f\n", result);
result=floatsum(a, number_of_items);
printf("Sum (asm version): %f\n", result);
free(a);
}
return 0;
}
歡迎來到Stack Overflow!這聽起來像你可能需要學習如何使用[調試器](https://en.wikipedia.org/wiki/Debugger)來遍歷你的代碼。使用一個好的調試器,您可以逐行執行您的程序,並查看它與您期望的偏離的位置。如果你打算做任何編程,這是一個重要的工具。進一步閱讀:[如何調試小程序](https://ericlippert.com/2014/03/05/how-to-debug-small-programs/)。 –
崩潰發生在哪裏?我猜''movaps(%eax),%xmm1'?如果是這樣的話,這可能是一個對齊問題。 –
是的,問題是由movaps(%eax)causeb,%xmm1,我該如何解決它? @PaulR – Daniele