我正在寫一個OpenCL內核,它涉及到循環中的幾個障礙。我已經在CPU(8核FX8150)上測試了內核,結果顯示這些障礙將運行速度降低了50〜100倍(我通過使用多線程+ CyclicBarrier在Java上重新實現內核進一步驗證了這一點) 。我懷疑原因是障礙,從本質上阻止了CPU利用無序執行,所以我有點擔心如果我觀察到GPU的速度降低幅度相同。我查了一些官方文件並搜索了一下,但有關此主題的信息很少。現代GPU(例如Fermi/Evergreen)是否支持亂序執行?
5
A
回答
7
當前國家的本領域GPU是有序流水線處理器。 GPU通過交織來自不同經紗(波前)的指令來有效地填充管道。在比較中,CPU使用亂序推測執行來填充管道。有不同的功能單元,如分離管道的ALU和SFU。但請注意,指令依賴性會阻止變形。有關在GPU上指令依賴關係解析的更多信息,請參閱this NVIDIA patent。
2
NVIDIA的下一代
CUDA計算與圖形架構,代號爲「Fermi」:
Nvidia GigaThread Engine具有開關 (第5頁)
- 快10倍的應用程序上下文的能力
- 並行內核執行
- 不按順序執行線程塊:) 個
- 雙重疊存儲器傳輸引擎
相關問題
- 1. Gensim庫是否支持GPU加速?
- 2. Tegra K1是否支持GPU上的RenderScript?
- 3. Arrayray python是否支持多GPU編程
- 4. Nvidia GPU是否支持管狀結構?
- 5. gpu支持的版本是否也支持cpu
- 6. 英特爾IPP是否支持任何支持OpenGL的GPU?
- 7. PSEXEC是否支持域間執行?
- 8. Spyne是否支持代理?
- 9. Windows現代應用程序是否支持CSS着色器?
- 10. 爲node.js執行任何Cassandra驅動程序是否支持SSL?
- 11. Java是否支持異常後恢復程序執行?
- 12. 如果處理器支持亂序執行,優化數據隱患是否有意義?
- 13. OpenGL多GPU支持
- 14. PyOpenCV支持GPU嗎?
- 15. 如何檢查主板是否支持多GPU?
- 16. 如何確定GPU是否支持OpenGL的Gamma校正
- 17. Node.js是否支持並行?
- 18. 是否在GPU上運行opengl代碼?
- 19. Alea GPU支持動態並行嗎?
- 20. MVVM Light SimpleIoC是否支持單例?
- 21. GeForce是否支持FFmpeg GPU加速視頻處理?
- 22. 奇點是否支持gpu資源框架功能?
- 23. cuda中是否支持GPU內核隊列?
- 24. Chrome是否支持Windows XP下2D Canvas的GPU硬件加速?
- 25. Raspery Pi 3 OpenCL GPU支持?
- 26. tensorflow的Mac OS GPU支持
- 27. Microsoft Azure中的GPU支持
- 28. OpenACC-OpenMP支持Arm Mali GPU
- 29. TensorFlow GPU支持Mac - OpenCL的
- 30. 查找支持的GPU
因爲它有。您應該通過代碼來異構地分割耗時的fpu計算,因此它可以執行整數計算。同時做漂浮 –
@tuğrulbüyükışık謝謝。你能否指出一個證明這一點的官方文件(僅供參考)? – aaronqli