0
我正在對LIDC-IDRI數據集上的分割網絡U-net進行培訓。目前有兩種訓練策略:1)從整個訓練集中訓練CNN和2)訓練集中的訓練集,然後是整個訓練集之間的區別是什麼?
- 從頭開始訓練整個訓練集的模型(40k步,180k步)。
- 對整個訓練集的10%進行訓練。收斂後(30k步),繼續在整個訓練集上訓練模型(10k步)。
隨着Dice coefficient作爲損失函數,這也是在V-網架構(paper)使用的,模型方法2訓練總是比用方法1.前者可以實現一個骰子得分的0.735更好,而後者只能達到0.71。
順便說一句,我的U型網模型在TensorFlow實現的,該模型是在NVIDIA GTX 1080Ti訓練有素
任何人都可以給予一定的解釋或引用。謝謝!