compute-capability

    1熱度

    1回答

    我目前正在爲計算能力5.2編譯CUDA代碼。我的機器恰好具有計算能力5.2 GPU(GeForce GTX 970)。但是,我的問題是:爲計算能力5.2編譯的代碼是否仍然在具有低至3的計算能力的計算機上運行? (假設代碼從不違反像共享內存差異等較低計算能力的限制)

    0熱度

    1回答

    讓我們假設我有一個代碼,讓用戶通過threads_per_block來調用內核。然後我想檢查一下,如果輸入有效(例如< = 512,計算能力CC < 2.0和1024(對於CC> = 2.0))。 現在我想知道如果我在使用CC2.0的計算機上顯示圖形卡時使用nvcc -arch=sm_13編寫代碼時,如果用戶通過threads_per_block == 1024,會發生什麼情況?是這樣的: 有效的

    1熱度

    1回答

    假設我有一個安裝了單個GPU的系統,並且假設我還安裝了最新版本的CUDA。 我想確定什麼是我的GPU的計算能力。如果我可以編譯代碼,這將是很容易: #include <stdio.h> int main() { cudaDeviceProp prop; cudaGetDeviceProperties(&prop, 0); printf("%d", prop.majo

    1熱度

    2回答

    我正在搭配GTX Titan卡(計算能力3.5)的機器上使用CUDA 6.5。我建設我的代碼只有-gencode=arch=compute_30,code=sm_30 -gencode=arch=compute_35,code=sm_35 - 當我鏈接到我的二進制,nvlink說: nvlink warning : SM Arch ('sm_20') not found in '/local/ey

    0熱度

    1回答

    我已經使用CUDA 7.5和cuDNN 5.0安裝了tensorflow。我的顯卡是支持2.1功能的NVIDIA Geforce 820M。但是,我得到這個錯誤。 Ignoring visible gpu device (device: 0, name: GeForce 820M, pci bus id: 0000:08:00.0) with Cuda compute capability 2.1