2015-09-29 58 views
9

推出Ubuntu服務器14.04 LTS(HVM)後後,他無法將 'nvidia_352',我試圖安裝CUDA如下錯誤:在EC2上g2.2xlarge安裝Cuda的

wget http://developer.download.nvidia.com/compute/cuda/repos/ubuntu1404/x86_64/cuda-repo-ubuntu1404_7.5-18_amd64.deb 
sudo dpkg -i cuda-repo-ubuntu1404_7.5-18_amd64.deb 
sudo apt-get update 
sudo apt-get install -y cuda 
export PATH=/usr/local/cuda-7.5/bin:$PATH 
export LD_LIBRARY_PATH=/usr/local/cuda-7.5/lib64:$LD_LIBRARY_PATH 
sudo reboot 

然後我運行一個測試

cuda-install-samples-7.5.sh . 
cd ~/NVIDIA_CUDA-7.5_Samples/1_Utilities/deviceQuery 
make 
./deviceQuery 

得到了錯誤:

modprobe: ERROR: could not insert 'nvidia_352': Unknown symbol in module, or unknown parameter (see dmesg) cudaGetDeviceCount returned 38 -> no CUDA-capable device is detected

出了什麼問題嗎?

+0

你找到了解決方案嗎? – Anoracx

+0

嘗試安裝CUDA 7(和CUDA 7 346.xx驅動程序)而不是CUDA 7.5 –

+2

CUDA 7.5和AWS gpu實例存在問題。看起來像Nvidia正在[進入它](https://devtalk.nvidia.com/default/topic/880246/cuda-7-5-unstable-on-ec2-/)。 CUDA 7現在應該工作得很好。 – osondoar

回答

2

在AWS gpu實例上看起來這是CUDA 7.5中的known issue。目前短期的解決方法似乎是降級到CUDA 7。


在2015年12月編輯補充,從NVIDIA羅伯特Crovella建議,CUDA 7.5 EC2 g2.2xlarge現在應該有352.63或更高版本的驅動程序可用。所以驅動程序更新應該可以解決問題。

[這個答案是從評論組裝並添加爲一個社區維基條目遇到的問題是關閉未回答列表]

10

升級Ubuntu和安裝的linux-image-額外之前安裝NVIDIA驅動程序 sudo apt-get update && sudo apt-get -y upgrade sudo apt-get install -y linux-image-extra-`uname -r`

+0

您是否確實在使用EC2 g2.2xlarge實例上運行的Ubuntu 14.04 LTS上的CUDA 7.5發行包證實了這一點? – talonmies

+0

這是我的解決方案! – grantathon