0
我正在使用VPADAL.U32
指令來大大提高我的加速代碼速度。然而,我需要一些東西來減去積累和攜帶(正是我所得到的)。ARM Neon:用於減法的VPADAL
如意算盤還是真的有可能?我需要減少我的第二個操作數,然後不是它的位...執行VPADAL
,然後對1進行位測試,並從結果進位中減1(到得到0或-1 - 我的積累)。
我在某處遺失奧術技術嗎?
我正在使用VPADAL.U32
指令來大大提高我的加速代碼速度。然而,我需要一些東西來減去積累和攜帶(正是我所得到的)。ARM Neon:用於減法的VPADAL
如意算盤還是真的有可能?我需要減少我的第二個操作數,然後不是它的位...執行VPADAL
,然後對1進行位測試,並從結果進位中減1(到得到0或-1 - 我的積累)。
我在某處遺失奧術技術嗎?
您可以使用VPADDL對加數進行兩兩相加,並將寬度加倍,然後使用VQSUB從總數中減去此項。