Hei!舊版本GPS上的DPPS
我需要優化c中的一些矩陣乘法代碼,並且我正在使用SSE向量指令來完成它。我還發現存在SSE4.1,它已經有了dot-product,dpps的說明。
的問題是,機器上的這個軟件是在那裏工作是安裝了舊版本的gcc(4.1.2),這對SSE4.1的支持,但它有一個支持它的處理器(唐」不問問爲什麼gcc版本比處理器更舊...)。所以我不能使用_mm_dp_ps函數。
我正在玩一些將彙編代碼添加到c的東西。問題是我從來沒有使用過彙編代碼,所以它真的讓人困惑。編寫彙編程序中處理向量指令的所有代碼是否更有效?
所以我問這裏是否有其他方法如何使用dpps指令,如果它甚至值得使用?