TensorFlow：是否有可能爲多GPU訓練恢復檢查點模型？

我目前正在使用一名主管，只使用TF-slim的預先訓練的權重構建一個圖形來執行轉移學習。我想知道是否有辦法在一開始就將檢查點模型恢復到多個推理模型？我主要關心的是，首先，TF存儲庫中的reference code中定義的名稱範圍可能會導致預先訓練的變量由於名稱不匹配而無法恢復。另外，鑑於我必須使用一個只有一個恢復變量的保護程序的主管，我怎麼能有多個保存程序來將相同的變量恢復到多個GPU（如果我甚至需要有多個保存程序）。TensorFlow：是否有可能爲多GPU訓練恢復檢查點模型？

我的一個想法是，也許我可以將變量恢復到一個圖形，並讓其他GPU使用相同的圖形進行訓練。但是，只有在第一個GPU完成後，下一個GPU的訓練纔會進行？但這樣，除非編輯檢查點權重的名稱，否則我將無法根據原始檢查點模型變量名稱恢復權重。

來源

2017-02-22 kwotsin

您可以隨時手動選取已保存變量的值，並在運行時將其分配給您的圖形。 – fabrizioM

我可以知道做這個的過程是什麼？另外，如果我在運行時恢復變量，而不是在運行模型之前首先初始化變量，它會不會變慢？ – kwotsin

TensorFlow：是否有可能爲多GPU訓練恢復檢查點模型？

回答

相關問題