-1
我試圖構建a distribute tensorflow framwork template,但有些問題困擾着我。在分佈式張量流列車上運行多個模型的步驟messd
- 當我在script使用
--sync_replas=True
,這是否意味着我用Synchronous training
在doc? - 爲什麼worker_0.log和worker_1.log 中的全局步驟不是連續遞增?
- 爲什麼全球一步不是從0開始,但像這樣
1499169072.773628: Worker 0: training step 1 done (global step: 339)
什麼
training step
和global step
之間的關係?正如您從create cluster script所看到的,我創建了一個獨立的羣集。我可以同時在此羣集上運行多個不同的模型嗎?