3
我目前正試圖優化從國產編譯器發出的代碼,用於自制語言。英特爾彙編優化
我已經試過了英特爾VTune,看看那裏的瓶頸是:http://www.imada.sdu.dk/~sorenh07/misc/vtune-assembly-optimization.png
我覺得非常令人印象深刻的是,「subl」 -instruction負責30運行的程序的clockticks不等的38%以上-90秒!有人可以解釋爲什麼嗎?
對於未使用icc編譯的程序,VTune中的「優化報告」功能顯然不存在。是否存在一個建議對彙編代碼進行優化的程序? (也就是說,不是來自高級語言的代碼)。
當然,subl必須等待idivl執行... – 2010-05-01 18:46:22