大會64位：如何返回一個雙精度值？

C-程序：

#include <stdio.h> 

double result=0; 
double a = 10; 
extern double func(double a); 

int main() {  
    result = func(a); 
    printf("result: %f\n", result);  
    return 0; 
    }

大會：

 section .bss 
     x: resq 1 

     section .text 

     global func 

     func: 

     movq qword[x],xmm0 
     fld qword [x] 
     fld qword [x] 
     fadd 
     movq xmm0,qword[x] 

     ret

它應該返回20.0而是它始終是10.0 我是怎麼了？

來源

2016-06-09 falcon

您從不存儲結果。順便說一句，使用SSE而不是x87可能會更簡單。 – ElderBug

Elderbug是正確的。 'fadd'添加st（0）和st（1）將值存儲在'st（0）'中。您不會使用堆棧頂部的值更新[x]中的值。在返回之前，也不要將額外的值從FPU堆棧彈出（如果您調用此函數5次，這會導致FPU堆棧溢出）。正如Elder指出的，除非給定的任務要求你這樣做，否則你可以使用SSE而不是FPU。 –

代碼也可以簡化，但我很好奇你在編譯32位或64位代碼嗎？我假設你得到的結果是，你的可執行文件是64位的。 –

發佈的代碼沒有評論。在談到它會幫助OP，所以......

movq qword[x],xmm0 ; Store current value in memory [Why?] 
fld qword [x]  ; Load current value from memory [Why??] 
fld qword [x]  ; Load current value from memory again 
fadd    ; Add top two stack items 
movq xmm0,qword[x] ; Read value from memory

@ElderBug指出，OP忘記了fadd的結果存儲到內存中做最後的movq之前。

@邁克爾佩奇指出，整體功能可能是多更高效的使用下面的代碼：

addsd xmm0, xmm0 ; Add input parameter to itself 
ret    ; Done!

@邁克爾佩奇接着指出，原來的代碼留下了大量的「碎片」的在浮點堆棧上 - 沒有試圖用各種指令版本（fstp或faddp而不是fadd）對其進行清理。這爲下一個浮點函數留下了更少的空間 - 直到最終導致浮點堆棧溢出！

來源

2016-06-13 11:58:57

您不能混淆FPU和XMM計算。當您計算FPU上的某些內容時，您必須將其存儲在內存中（如@Elderbug所述），然後您必須將其加載到XMM寄存器，以便在Win OS上以64位處理器上的64位處理器進行恢復。在64位系統上仍然可以使用FPU，因此FPU的內部精度可以爲80位（如果使用正確的FPU控制字：位8,9 float32（24位尾數）= 00b 雙浮點（53位尾數）= 10B 擴展精度（64位尾數）= 11B

如果你想使用的FPU：

fld QWORD PTR x ; laod var to FPU: into ST(0) (MASM Syntax) 
fadd ST(0), ST(0) ; this adds [x]+[x] 
fstp QWORD PTR x ; store result back in var 
movsd xmm0, QWORD PTR x

注：MOVSD總是SSE2需要（在SSE1機器上。 GP會發生故障！請參閱英特爾®64和IA-32架構軟件開發人員手冊： http://www.intel.com/content/www/us/en/processors/architectures-software-developer-manuals.html Howeve r，如果你運行的Windows8/8.1/10對你來說永遠不是問題，那麼會導致操作系統本身要求SSE2作爲系統要求。

編輯：SSE2是x86-x64中的基準（正如Peter評論中所述），因此您可以在64位上始終使用它。

如果你想使用SIMD與XMM寄存器：

movsd xmm0, QWORD PTR x 
addsd xmm0, xmm0 ; this instruction also requires SSE2 
; ok, retun xmm0

還要注意，你也不能混淆XMM和MMX-寄存器！（指令MOVQ2DQ和MOVDQ2Q可以將它們從一個轉換到另一個，但其他指令不能）

如果您的函數使用參數，並且它應該在Windows操作系統上運行，則需要確保有效的函數prolog /結語。請參閱：https://future2048.blogspot.com

來源

2016-08-26 22:49:50

x86-64以SSE2作爲基準。您的SSE1警告只適用於您在32位代碼中執行此操作的情況。（你可能不應該使用一個調用約定，它會在沒有SSE2的機器上運行的代碼中返回xmm regs中的雙精度，但如果你只想使用SSE1，你仍然可以使用['movlps']（http：但不要因爲它會與寄存器的舊內容合併，而不是將高64位清零（錯誤依賴xmm寄存器的舊值）） –

此外，重新：x87精度控制的初始設置：請參閱[這是布魯斯道森關於FP的一系列優秀文章]（https://randomascii.wordpress.com/2012/03/21/intermediate-floatingpoint -精確/）。 VC++的CRT代碼將x87單元設置爲53位尾數精度，至少對於32位可執行文件。我沒有重新閱讀整篇文章，看看它何時離開。我想我已經讀了一些關於directx改變x87精度的內容。很高興我不使用Windows。 :) –

大會64位：如何返回一個雙精度值？

回答

相關問題