2013-05-16 39 views
0

我需要做大量的向量計算。所以我認爲NEON應該被使用。問題在於功能取決於雙打。這給了我兩個選擇,重新編寫整個代碼,以便它可以與浮點數一起使用,或者創建一個函數,使用雙精度作爲輸入,雙精度作爲輸出並使用浮點數進行計算。如何使用NEON和ARM處理器中的雙精度值來計算dotproduct

我需要做下面的計算:

dotproduct = A[0]*B[0] + A[1]*B[1] + A[2]*B[2] 

陣列的尺寸爲雙打。我如何使用NEON內在函數進行這種計算?

+0

假設它是性能而不是精度,最好在每個使用霓虹燈的地方使用單精度,並減少內存空間/帶寬成本。 – auselen

回答

4

NEON不支持雙精度操作。您將不得不重寫您的函數以使用單精度值,或者使用標量雙精度VFP指令而不是NEON。