在OpenCL中,有可能由多個GPU組成的系統隱式劃分作業,而程序員不明確劃分工作負載?
例如說我有一個由1個SM192核心GPU組成的GPU,並運行一個矩陣乘法,這個算法正常工作。現在我添加了另一個相同的GPU,並且OpenCL使用GPU來計算它的矩陣乘法,而不是程序員將工作負載分配給每個GPU。多GPU的隱式工作
0
A
回答
1
我不認爲OpenCL可以自動做到這一點(至少在1.2),但有一些OpenCL包裝可以自動處理多個計算設備。我沒有使用OpenCL CodeBench
,但他們聲稱他們有多個計算設備的負載平衡。
0
你可以只統一設備的記憶,並且只能使用opencl及更高版本的2.0。
內核在命令隊列中排隊,並且它們使用(並綁定到)單個設備創建。所以他們只能在單個設備上工作。但是多個命令隊列可以在可以利用隱式緩衝區同步的通用上下文中服務。
拆分工作不能隱式完成,因爲它在運行時無法知道哪個工作項訪問哪個內存地址。
一旦你編寫了一個可用的單設備封裝器,添加多GPU支持並不麻煩。
相關問題
- 1. 多GPU的SLI
- 2. Silverlight Childwindow +隱式樣式不工作
- 3. 多GPU似乎無法在TensorFlow1.0上工作
- 4. GPU內存延遲隱藏?
- 5. cudaMallocHost/cudaHostAlloc多GPU
- 6. theanorc對多GPU
- 7. Python:並行化GPU和CPU工作
- 8. Opencv gpu :: split不能正常工作
- 9. cv :: gpu :: HoughLines無法正常工作
- 10. 隱式聲明如何工作
- 11. 隱式授權流程如何工作?
- 12. scala隱式值如何工作?
- 13. 隱式繼承在Java中工作
- 14. Tensorflow GPU /多GPU如何分配內存?
- 15. TensorFlow從多個GPU選擇GPU使用
- 16. 當它是PC中唯一的gpu時,nvidia gpu是否工作效率較低?
- 17. 如何在多個GPU節點上獲取分配給SLURM作業的GPU ID?
- 18. 多GPU Cuda計算
- 19. tensorflow多GPU訓練
- 20. 有多少個GPU?
- 21. 多GPU CUDA推力
- 22. OpenGL多GPU支持
- 23. 工作表公式顯示標籤隱藏的公式
- 24. 多GPU的基本用法
- 25. tensorpow.slim.learning多GPU的培訓
- 26. jQuery的隱藏不工作
- 27. jQuery的隱藏()不工作
- 28. 更新多個工作表的格式
- 29. 隱藏工作簿/工作表Excel VBA
- 30. 爲什麼C++隱式轉換工作,但明確的轉換不工作?
那麼在這兩塊GPU卡上各有1個SM,系統總共會識別出2個SM存在於系統中? – pradyot