我懷疑tensorflow是否對我的GPU箱配置正確,因爲它每次迭代訓練一個簡單的線性迴歸模型約100倍慢(BATCHSIZE = 32,1500點輸入的特徵,150個輸出變量)在我的花式gpu機器上比在我的筆記本電腦上。速度基準測試tensorflow安裝
我正在使用泰坦X,與現代cpu等nvidia-smi說,我只有在10%的gpu利用率,但我希望這是因爲小批量。我沒有使用feed_dict將數據移動到計算圖中。一切都通過tf.decode_csv和tf.train.shuffle_batch來完成。
沒有人有任何建議,如何輕鬆地測試是否我的安裝是否正確?有沒有簡單的速度基準?我的筆記本電腦和gpu機器之間的速度差異非常大,以至於我預料事情沒有正確配置。
一些例子不是GPU優化,當GPU是因爲拷貝的啓用可以得到100倍的更慢,這裏有一個HTTPS: //github.com/tensorflow/tensorflow/issues/838 –