我在OpenMP,TBB和OpenCL中實現了很少的正常循環應用程序。在所有這些應用程序中,當我僅在CPU上運行Operate時,Operate的性能遠遠優於其他應用程序,而在內核中沒有進行特定的優化。 OpenMP和TBB也有很好的性能,但遠低於OpenCL,可能是因爲這些都是CPU專用框架,並且至少應該提供與OpenMP/TBB相同的性能。OpenCL,TBB,OpenMP
我的第二個問題是,當涉及到OpenMP和TBB時,OpenMP在性能上總是比TBB好,因爲在我的實現中,我沒有對它進行優化,因爲我並不那麼專業。 OpenMP性能通常比TBB更好嗎?因爲我認爲他們兩個甚至是OpenCL都會在低層使用相同類型的線程池......任何專家意見?謝謝
你的算法是什麼?什麼是您的操作系統和編譯器? – osgx