我覺得需要速度。 Double for循環會導致我的iPad應用程序性能下降。我需要SIMD。如何在iPad A4處理器上執行整數SIMD操作?如何在iPad A4處理器上執行整數SIMD操作?
感謝,
道格
我覺得需要速度。 Double for循環會導致我的iPad應用程序性能下降。我需要SIMD。如何在iPad A4處理器上執行整數SIMD操作?如何在iPad A4處理器上執行整數SIMD操作?
感謝,
道格
爲了獲得最快的速度,你必須編寫使用NEON SIMD操作的ARM彙編語言代碼,因爲C編譯器通常不會編譯非常好的SIMD代碼,所以手寫彙編將會產生很大的差異。我有一個簡短的介紹在這裏:http://www.shervinemami.co.cc/iphoneAssembly.html
注意的是,iPad的A4採用的ARMv7-A的CPU,因此對於NEON SIMD指令的參考手冊在:http://infocenter.arm.com/help/topic/com.arm.doc.ddi0406b/index.html (但其2000頁長,需要組裝的理解代碼,也許一般SIMD!)。
指令集NEON,intrinsics reference
我從來沒有能夠找到什麼他們都其實都是很好的文檔。但是如果你已經接觸到了SSE,你很快就會發現它。
呃,而上證所是...? – dugla 2010-10-03 11:47:05
SSE是針對x86的SIMD,您嘗試使用什麼代碼進行矢量化? – 2010-10-03 15:07:25
這是一個圖像處理應用程序。我需要將通常使用LUT完成的窗口級操作轉換爲SIMD操作。我需要儘可能快地觸摸屏幕上的每個像素。使用GPU + GLSL使事情變得複雜。 – dugla 2010-10-04 01:05:32