我想要做以下事情: 我有8個值(8 x 1字節)在一個霓虹燈D-Register(= 64位)。現在我需要將每個值3移到左邊,但我不想失去任何比特。 之後,我需要向向量中的每個值添加相同的32位值。ARM Neon Assembler - 處理溢出寄存器
據我瞭解,如果溢出,我可以使用指令VQSHL將結果放入2個D寄存器中?我怎麼知道溢出是否發生,並保證/強制我的所有數據都在新的寄存器中?
你也可以幫我一些代碼換班和添加部分?
例如代碼:
OUT0 = CONSTANT_32BIT +(INPUT0 < < 3)
OUT1 = CONSTANT_32BIT +(輸入1 < < 3)
OUT_N = CONSTANT_32BIT +(input_n < < 3 )
所以理論上我可以使用Neon寄存器並行執行8或16條指令?
目標是ARM Cortex-A9(如果這很重要)。
什麼尺寸爲OUT0? – 2012-03-08 03:26:15