1
我有一個非常簡單的程序,我試圖提高性能。我知道的一個方法是利用SSE3(因爲我工作的機器支持這一點),但我完全不知道如何去做。下面的代碼片段(C++):真正基本的SSE
int sum1, sum2, sum3, sum4;
for (int i=0; i<length; i+=4) {
for (int j=0; j<length; j+=4) {
sum1 = sum1 + input->value[i][j];
sum2 = sum2 + input->value[i+1][j+1];
sum3 = sum3 + input->value[i+2][j+3];
sum4 = sum4 + input->value[i+3][j+4];
{
}
我讀過一些關於這一點,並瞭解的想法,但我完全不知道如何實現這一點。有人可以幫我嗎?我認爲這很簡單,特別是對於我的簡單程序,但有時候入門是最難的部分。
謝謝!