2017-04-23 65 views

回答

1

在馬爾可夫鏈中燃燒的問題足以抑制遠離初始值的訓練集中的高能量區域。這是典型的使用CD(1)或任何低階對比分歧。也就是說,這些方法通常會初始化遠離本地最優值的權重,以免非預先訓練的網絡卡住。

RBM也用模擬退火訓練,所以更有可能探索更多的參數空間。

我也推薦你閱讀論文了解深度學習需要重新思考Zhang等人的泛化。它基本上顯示了這些網絡如何完全記住概率分佈,並且仍然可以推廣。