在CUDA

cuda
raii

2013-09-25 33 views 2 likes

Considere我的問題的這種簡化版本內核調用後預防析構函數調用：將數據傳遞到一個CUDA內核，我用它保存數據和指向上的圖形設備數據的類。在CUDA

class A { 
    int data; 
    float* dataOnGPU; 
    A() { cudaMalloc(dataOnGPU ...); } 
    ~A() { cudaFree(dataOnGPU ...); } 
}; 

void myFunction() 
{ 
    A obj; 
    kernelCall1<<<1,1>>>(obj); 
    kernelCall2<<<1,1>>>(obj); // obj.dataOnGPU no longer points to valid memory 

}

返回形成調用obj的拷貝的析構函數的第一內核調用的結果（因爲內核由值調用時，它創建了一個副本）。這爲obj和它的副本釋放dataOnGPU。在obj超出範圍之前，obj.dataOnGPU的內存不應該是空閒的。

當然，有可能避免這種情況，但我希望有良好和乾淨的RAII行爲。有什麼建議麼？

來源

2013-09-25 Dirk

回答

你可以你的析構函數更改爲：

~A() { cudaDeviceSynchronize(); cudaFree(dataOnGPU ...); }

這樣內核之前，你的可用內存運行完成。

來源

2013-09-25 12:55:04

這將仍然是免費的obj.dataOnGPU應在第二內核可呼叫。 – Dirk

好的 - 所以你只有A級的淺拷貝？ –

是的，確切地說。我認爲指定沒有複製構造函數表示執行淺拷貝。 – Dirk

使用自定義的拷貝構造函數是解決辦法：

class A { 
    int data; 
    float* dataOnGPU; 
    bool isCopy; 
    A() { cudaMalloc(dataOnGPU ...); isCopy = false; } 
    A(const A& _orig) { *this = _orig; isCopy = true; } 
    ~A() { if (!isCopy) cudaFree(dataOnGPU ...); } 
}; 

void myFunction() 
{ 
    A obj; 
    kernelCall1<<<1,1>>>(obj); 
    kernelCall2<<<1,1>>>(obj); // obj.dataOnGPU still points to valid memory 
}

感謝保羅的R用間接指向我這個:)

來源

2013-09-25 13:34:21 Dirk

相關問題

11. 同步在CUDA
12. CUDA，在共享memroy
13. CUDA 5與CUDA 4兼容
14. CUDA-GDB：沒有CUDA設備
15. Nvidia Cuda計劃 - 我的Cuda適合Cuda架構嗎？
16. 對CUDA
17. CUDA __threadfence（）
18. 對CUDA
19. CUDA __device__
20. 對CUDA
21. CUDA MemcpyHostToDevice
22. 與CUDA
23. 與CUDA
24. 與CUDA
25. CUDA cudaMalloc
26. 對CUDA
27. CUDA，如何實現在CUDA內核結構的動態數組
28. 如何在cpp和cuda模塊中使用cuda類頭文件
29. CMake + Cuda：在Cuda模式下編譯cpp文件（--x = cu）
30. 在非CUDA機器上運行CUDA程序