我一直在努力向量化某個特定的應用程序,現在我已經嘗試了一切。從自動矢量化到手動編碼的SSE內部函數。但不知何故,我無法在基於模板的應用程序上獲得加速。 以下是我使用SSE intrinsics矢量化的當前代碼片段。當我使用-vec-報告3把它編譯(英特爾ICC)我經常得到這樣的信息: 注:循環不矢量:語句不能量化。 #pragma ivdep
for (i = STENCIL; i <
我有一個C++項目,使用marray庫。目前它在Windows 7 x64上使用MinGW g ++ 4.7和msvc2010進行編譯和運行,Linux Mint x64上也使用g ++ 4.7進行編譯和運行。我決定嘗試一下Linux的英特爾C++編譯器v。12.1.4。它能夠編譯代碼,但是當它試圖執行任何干擾表達式模板的行時(如c = a + b,其中所有三個項都是矩陣),它就會隨着分段錯誤而崩