3
我在xmm0
有兩個打包的四字整數,我需要將它們加在一起並將結果存儲在內存位置。我可以保證每個整數的值小於2^15。現在,我正在做以下事情:添加一個128位xmm寄存器的高64位和低64位
int temp;
....
movdq2q mm0, xmm0
psrldq xmm0, 8
movdq2q mm1, xmm0
paddq mm0,mm1
movd temp, mm0
有沒有更好的方法來做到這一點?
@Stephen:以前的操作需要雙四字同時處理128字節的信息。在那之後,一系列的求和產生了上述上限的最終結果。 – Jacob 2009-12-11 22:12:36
*聳肩*,夠公平。無論如何,我提出的任何序列都應該爲你工作,並避免傳統的mmx用法。 – 2009-12-11 22:16:21
謝謝!它實際上弄亂了我的代碼的其餘部分,所有的浮點數都減少到-1。 – Jacob 2009-12-11 22:18:55