2012-12-27 61 views
5
float a[4] = {1,2,3,4}, b[4] = {4,3,2,1}; 
uint32_t c[4]; 

int main() { 

    __m128 pa = _mm_loadu_ps(a); 

    __m128 pb = _mm_loadu_ps(b); 
    __m128 pc = _mm_cmpgt_ps(pa, pb); 
    _mm_storeu_ps((float*)c, pc); 
    for (int i = 0;i < 4; ++i) printf("%u\n", c[i]); 
    return 0; 
} 

什麼是_mm_storeu_ps((float*)c, pc)的正確指令? 這裏,c是一個整數數組...我不認爲這種方式是好的,更好?如何將__m128轉換爲整數

+0

我的眼睛......他們傷害......我查過一次,那'__m128'憎惡是不是在C++標準。 –

回答

7

有兩個指令以轉換__m128float載體中)進入__m128iint32_t矢量)在SSE2:_mm_cvtps_epi32(舍入),並_mm_cvttps_epi32(帶截斷)。

__m128i vi = _mm_cvttps_epi32(pc); 
_mm_storeu_si128((__m128i *)c, vi); 

如果您不能使用SSE2,你應該存儲pcfloat陣列後轉換float陣列int陣列。

float d[4]; 
_mm_storeu_ps(d, pc); 
c[0] = (int)d[0]; c[1] = (int)d[1]; c[2] = (int)d[2]; c[3] = (int)d[3];