2012-03-02 90 views
9

與英特爾IPP庫鏈接時,某些DSP類型的工作負載似乎在英特爾x86 x86_64處理器上顯示出非常顯着的性能提升。是否有任何ARM等效的英特爾IPP?

想知道ARM端是否有類似的東西?尤其是,這可能會在ARM9,ARM11和Cortex-A8/A9中工作(不一定具有相同的性能提升水平)。

最後,這個下面的問題,可能不是正確/可以接受的,所以MODS請友好留下評論,我可以編輯它。

我一直在嘗試閱讀IPP的許可協議,但尚不清楚Linux上的商業IPP許可證是否售價爲199美元及以上的稅款,是否有權向一個個人副本授權(但可能用於商業用途)的圖書館,還是可以將他們的申請與這個圖書館聯繫起來並出售以獲得商業利益?還是需要一種不同類型的許可證?無法找出在intel網站上的地方來問這個問題(沒有什麼像聯繫銷售)!

回答

6

根據你的看法,你的問題有幾個答案。

英特爾IPP是一個具有許多預煮功能的庫,用於執行常見任務,如快速傅里葉變換等。 有在開源社區做同樣的特定庫,看看:

等等。不是所有這些庫都針對各種ARM內核進行了優化。

您的問題的第二個角度是爲什麼您想要在不同的ARM內核上工作的原因。在Cortex A系列處理器上,您可以使用(可選的)ARM NEON SIMD指令(如MMX/SSE/AltiVec)一次採集一組數據並對其應用多種操作。這減少了處理大量數據所需的指令數量。 ARM11xx系列有一些類似但更受限制的稱爲VFP3。 ARM9xx系列真的缺乏這種優化。 除此之外,ARM體系結構具有Thumb和Thumb2,可以產生更小更快的代碼。

最終結果是,真正運行在多個ARM內核上的優化庫需要針對不同工作負載實現相同算法的多個實現。這會增加庫的大小。你願意付出那個價格嗎?

4

在iOS上,有一個針對使用SIMD的ARM進行優化的加速框架,如果可用的話。請參閱Apple的文檔here

+0

有趣。從來沒有聽說過。絕對值得一看。 – 2013-04-28 14:39:53

8

還有ARM sponsored開源項目項目Ne10它最初涵蓋了一小組浮點,矢量算術和矩陣處理函數。

+0

感謝您的回饋!看起來很有趣。 – icarus74 2012-09-11 08:31:37

相關問題