我已經找到了SSE移位指令可以相同數額上的所有元素只轉移: _mm_sll_epi32() _mm_slli_epi32() These shift all elements, but by the same shift amount. 是否有應用不同的方式轉移到不同的元素?類似這樣的: __m128i a, __m128i b;
r0:= a0 << b0;
r1:= a1 << b1;
在SSE,如果我有一個包含4個浮點即 A = a b c d ('a','b','c','d' are floats and 'A' is a 128-bit SSE register)
和 B = e f g h
然後如果我想一個128位寄存器 C = a e b f
我可以簡單地做: C = _mm_unpacklo_ps(A,B);
同樣的,如果我想 D = c g d h