2010-05-01 181 views
3

我目前正試圖優化從國產編譯器發出的代碼,用於自制語言。英特爾彙編優化

我已經試過了英特爾VTune,看看那裏的瓶頸是:http://www.imada.sdu.dk/~sorenh07/misc/vtune-assembly-optimization.png

我覺得非常令人印象深刻的是,「subl」 -instruction負責30運行的程序的clockticks不等的38%以上-90秒!有人可以解釋爲什麼嗎?

對於未使用icc編譯的程序,VTune中的「優化報告」功能顯然不存在。是否存在一個建議對彙編代碼進行優化的程序? (也就是說,不是來自高級語言的代碼)。

回答

2

我的猜測是,這是idivl指令,實際上佔用了38%...部門需要更長的時間比減法沒有更有意義?

+0

當然,subl必須等待idivl執行... – 2010-05-01 18:46:22