我想提高使用Neon指令在ARM彙編器中編寫的一段代碼的性能。ARM Neon Assembler - 奇怪的管線問題
爲了測試和計算我用這個計算器: http://pulsar.webshaker.net/ccc/sample-706454b3
我注意到,在行「n.34-0 1C NO」突然NEON單元似乎已經等待了10個週期(?)。這可能是什麼原因或者它只是計算器中的一個錯誤?
另外我還需要一些關於如何提高ARM/Neon彙編器性能的一般信息。
目標是ARM Cortex-A9。 編譯我使用最新的android-ndk與內聯彙編器。謝謝。
如果緩存命中,那些危險只有1〜2個週期。在這種情況下,它有些不同。 – 2012-03-18 08:15:15