compute-capability

1熱度

1回答

我目前正在爲計算能力5.2編譯CUDA代碼。我的機器恰好具有計算能力5.2 GPU（GeForce GTX 970）。但是，我的問題是：爲計算能力5.2編譯的代碼是否仍然在具有低至3的計算能力的計算機上運行？（假設代碼從不違反像共享內存差異等較低計算能力的限制）

0熱度

1回答

編譯時的CUDA設備屬性和計算能力

讓我們假設我有一個代碼，讓用戶通過threads_per_block來調用內核。然後我想檢查一下，如果輸入有效（例如< = 512，計算能力CC < 2.0和1024（對於CC> = 2.0））。現在我想知道如果我在使用CC2.0的計算機上顯示圖形卡時使用nvcc -arch=sm_13編寫代碼時，如果用戶通過threads_per_block == 1024，會發生什麼情況？是這樣的：有效的

1熱度

1回答

我可以調用哪些實用程序/二進制文件來確定nVIDIA GPU的計算能力？

假設我有一個安裝了單個GPU的系統，並且假設我還安裝了最新版本的CUDA。我想確定什麼是我的GPU的計算能力。如果我可以編譯代碼，這將是很容易： #include <stdio.h> int main() { cudaDeviceProp prop; cudaGetDeviceProperties(&prop, 0); printf("%d", prop.majo

1熱度

2回答

爲什麼nvlink警告我缺少sm_20（計算能力2.0）目標代碼？

我正在搭配GTX Titan卡（計算能力3.5）的機器上使用CUDA 6.5。我建設我的代碼只有-gencode=arch=compute_30,code=sm_30 -gencode=arch=compute_35,code=sm_35 - 當我鏈接到我的二進制，nvlink說： nvlink warning : SM Arch ('sm_20') not found in '/local/ey

0熱度

1回答

不能在Tensorflow中使用GPU

我已經使用CUDA 7.5和cuDNN 5.0安裝了tensorflow。我的顯卡是支持2.1功能的NVIDIA Geforce 820M。但是，我得到這個錯誤。 Ignoring visible gpu device (device: 0, name: GeForce 820M, pci bus id: 0000:08:00.0) with Cuda compute capability 2.1