Q

在tensorflow

2017-04-16 82 views 0 likes

0

我知道訓練DNN當使用多個GPU的一個數據集在一次而不是分裂的數據集，用通常的方式多GPU是拆分數據集，每個分割數據集分配給每個GPU。在tensorflow

然而，有沒有使用多GPU爲不可分割的，整個數據集的計算速度更快的方式？我的意思是當GPU用於訓練網絡時，矩陣乘法在單GPU內並行化。我可以通過一次使用多個GPU來更快地實現矩陣乘法？

例如，我只有一張數據集圖片。由於我沒有多張圖片用於分割並分發到多個GPU，因此我希望利用所有GPU來爲此一個圖片計算做出貢獻。

在Tensorflow中可能嗎？我在互聯網上搜索，但沒有發現，因爲這是非常罕見的情況。

2017-04-16 Minkyu Choi

A

回答

0

你試圖做類似model parallelism。在tensorflow中做這件事有點難。

使用兩個GPU卡並行化matmul的一種方法。 A X B = C,A,B,C是形狀爲(m,k),(k,n),(m,n)的矩陣。您可以：

分裂A到A1和A2與(m/2, k), (m/2, k)形狀。
在GPU1上放置A1並在GPU2上放置A2。
重複B到兩個GPU。
同時計算A1 X B = C1和A2 X B = C2。
連接C1和C2得到C。

Tensorflow這類運營商split，concanate，由於乙方應在兩個GPU進行復制，可以將B上的parameter server。

2017-04-16 17:53:18 pgplus1628

相關問題

11. 在Tensorflow
12. Tensorflow「wheel not supported」，與Tensorflow存在問題
13. 在tensorflow 0.12
14. tensorflow tf.Print在Jupyter
15. 輸出在tensorflow
16. BatchNormalization在TensorFlow
17. 不能在tensorflow
18. SVD在Tensorflow
19. 替代在tensorflow
20. 兩個在tensorflow
21. CDF在tensorflow
22. tensorflow在RNN
23. 放大在tensorflow
24. 骨料在tensorflow
25. 試圖在Tensorflow
26. 訪問在Tensorflow
27. Tensorflow：在卷積
28. 如何在Tensorflow
29. FailedPreconditionError在TensorFlow
30. 實現在TensorFlow