培訓在家庭網絡中分佈的tensorflow模型(使用Estimator API)的最簡單方法是什麼?看起來不像ml引擎local train允許您指定IP。最簡單的方式分發Tensorflow培訓的前提?
0
A
回答
1
最好的選擇是使用類似Kubernetes的東西。這是一項正在進行的工作,但我相信它也支持分佈式培訓 - https://github.com/tensorflow/k8s。
或者更多低技術含量的自動化選項,這些浮現在腦海中......
- 你可以有它仍然使用SSH或遠程執行腳本的腳本。
- 您可以讓每個工作人員輪詢文件的共享位置,以用作下載和執行腳本的信號。
-1
您可以設置環境變量TF_CONFIG,這將由估計器進行解析。
相關問題
- 1. 在Tensorflow上培訓多GPU:更簡單的方法?
- 2. TensorFlow培訓
- 3. TensorFlow培訓圖片
- 4. Tensorflow Slim Imagenet培訓
- 5. Tensorflow Slim的批量培訓
- 6. Tensorflow最大利潤損失培訓?
- 7. Tensorflow分批培訓數據批量
- 8. tf.estimator的分佈式培訓導致更多的培訓步驟
- 9. 谷歌tensorflow objectdetection培訓
- 10. XGboost - 提高培訓錯誤 「前」
- 11. 最佳PHP培訓?
- 12. Android培訓:簡單地拍照
- 13. tf.learn Estimators的分佈式培訓?
- 14. 分佈式Tensorflow,Master在培訓時卡住了,工作人員沒有開始培訓,而使用SyncReplicasOptimizer和MonitoredTrainingSession?
- 15. 如何完成這個非常簡單的分佈式培訓示例?
- 16. 培訓InceptionV3網絡不工作(Tensorflow)
- 17. 通過Tensorflow進行培訓和預測
- 18. 慢tensorflow培訓和評估GPU
- 19. 培訓Tensorflow識別特定圖像
- 20. Tensorflow培訓/驗證損失nan問題
- 21. Tensorflow如何讓培訓步長值
- 22. Tensorflow SEQ2SEQ培訓突然超慢
- 23. Keras + TensorFlow實時培訓圖表
- 24. TensorFlow - GPU加速只用於培訓?
- 25. Tensorflow RNN培訓不會執行?
- 26. 培訓tensorflow崩潰計算機
- 27. Tensorflow 1.0培訓模式使用指數級更多的空間
- 28. 實習生培訓 - 最佳方法?
- 29. Tensorflow:從培訓課程中選擇最佳模型
- 30. 最簡單的方式發佈AAR
我知道它是如何工作的。但是,最簡單的方法是什麼?我不想讓每一臺機器都進入ssh,然後手動運行這些腳本。 –