0
我需要做大量的向量計算。所以我認爲NEON應該被使用。問題在於功能取決於雙打。這給了我兩個選擇,重新編寫整個代碼,以便它可以與浮點數一起使用,或者創建一個函數,使用雙精度作爲輸入,雙精度作爲輸出並使用浮點數進行計算。如何使用NEON和ARM處理器中的雙精度值來計算dotproduct
我需要做下面的計算:
dotproduct = A[0]*B[0] + A[1]*B[1] + A[2]*B[2]
陣列的尺寸爲雙打。我如何使用NEON內在函數進行這種計算?
假設它是性能而不是精度,最好在每個使用霓虹燈的地方使用單精度,並減少內存空間/帶寬成本。 – auselen