這裏是我編譯器在彙編器中的一些輸出。它是基於GCC v3.23的MPLAB C30 C編譯器,用於dsPIC33FJ128GP802(一款16位中等高速DSP/MCU)。這是一個優化錯誤嗎?
212: inline uint16_t ror_16(uint16_t word, int num)
213: {
078C4 608270 and.w w1,#16,w4
078C6 DE0204 lsr w0,w4,w4
078C8 780101 mov.w w1,w2
078CA EA8102 com.w w2,w2
078CC EA8183 com.w w3,w3
078CE 610170 and.w w2,#16,w2
078D0 DD0002 sl w0,w2,w0
078D2 700004 ior.w w0,w4,w0
214: num &= 16; // limit to 16 shifts
215: return (word >> num) | (word << (16 - num));
216: }
078D4 060000 return
特別我感興趣的以下內容:
and.w w1,#16,w4 AND W1 with 16, storing result in W4
lsr w0,w4,w4 Logical shift right W0 by W4 times storing result in W4
mov.w w1,w2 Move W1 to W2
com.w w2,w2 Logical complement of W2 stored in W2
com.w w3,w3 Logical complement of W3 stored in W3 <-- This line is confusing me
and.w w2,#16,w2 AND W2 with 16, storing result in W2
sl w0,w2,w0 (Logical) shift left W0 left by W2 times storing result in W0
ior.w w0,w4,w0 Inclusive OR of W0 and W4 stored in W0
return Return from function
W0..W15是16上芯片16位寄存器的陣列。
有效地簡化爲(在原始RTL):
W4 := W1 & 16
W4 := W0 LSR W4
W1 := W2
W2 := COM W2
W3 := COM W3
W2 := W2 & 16
W0 := W0 SL W2
W0 := W0 | W4
return
現在我在的時候只有兩個傳遞的參數(W0和W1爲什麼它被計算W3的補困惑 - 它使用W數組用於將參數傳遞給具有較小參數的函數的函數)。W3從不用於計算,並且永不返回。事實上,它甚至沒有數據:函數中沒有任何內容存儲,只有被調用者將有一些數據(雖然函數不需要保存W0..W7,因此被調用者不應該依靠它。)爲什麼它包含在代碼中?它只是一個編譯器故障或錯誤,或者我錯過了什麼?
這不僅僅是這個代碼 - 我在代碼的其他部分看到了同樣的奇怪。即使設計用於計算諸如16位變量的補碼之類的代碼,似乎總是使用兩個寄存器。它讓我失去了!
這可能是指令集設計一個怪癖。也許管道工作的方式是,在使用前一個結果之前,你應該總是執行另一個`COM`指令。 – 2011-01-22 22:01:34
@Pascal Cuoq在這個處理器上沒有這樣的流水線。也許它有兩級流水線(所以它可以操作讀取 - 解碼 - 執行 - 寫入RISC週期),但它不依賴於前面的指令。它的唯一延遲來自分支機構和指令跳過。 – 2011-01-22 22:06:07