2016-04-08 90 views
7

在訓練網絡時,每N次迭代拍攝的快照一起以兩種形式出現。一個是.solverstate文件,我認爲它正是它聽起來的樣子,存儲丟失函數和漸變的狀態等。另一個是.caffemodel文件,我知道它存儲了訓練過的參數。Caffe快照:.solverstate vs .caffemodel

如果你想要一個預先訓練好的模型,.caffemodel是你需要的文件,所以我想如果你要測試你的網絡,它也是你想要的文件。

WWhat是.solverstate的優點嗎?在this tutorial看起來你可以重新開始訓練,但是與使用.caffemodel有什麼不同呢? .solverstate是否也包含與.caffemodel相同的信息?換句話說,.caffemodel只是.solverstate的一個子集?

回答

4

solverstate文件,因爲其名稱傳達,存儲解算器的狀態,而不是任何有關分類結果的信息。該模型被保存爲caffemodel文件,您可以使用它來獲取數據的分類結果。如果你想微調你的網絡,你可以使用預先訓練好的caffemodel文件。這將節省時間,因爲您的網絡不需要從頭開始學習。但是,如果您目前的培訓需要停止,由於停電或意外重啓,您可以恢復您以前的solverstate快照的培訓。使用solverstate和caffemodel文件的區別在於,前者允許您以預定方式完成訓練,而後者可能需要更改某些訓練參數,如最大迭代次數。