2012-04-10 51 views
1

在我看來,交叉驗證用於通過使用盡可能多的數據來比較模型。例如,它可以用來比較一個感知器神經網絡和一個決策樹來解決同一個問題。或者它可以用來研究特定問題的神經網絡的數量。這裏是關於比較模型/架構。儘管如此,在我看來,交叉驗證似乎並不適合找到神經網絡的最佳權重,因爲在交叉驗證的每一輪中,權重都會重新初始化。交叉驗證是用來尋找最佳模型/體系結構還是模型/體系結構的最佳參數?

你能證實我的觀點嗎?交叉驗證僅用於比較模型/體系結構,不適合查找這些模型/體系結構的最佳參數?

謝謝。

+0

+1個好問題 – doug 2012-04-11 01:18:07

回答

1

你有正確的想法,是的。

通常,您使用交叉驗證來估計未見數據的準確性。此估算值可幫助您選擇合適的型號類型/參數等。

確定模型配置後,可以在整個數據集上訓練模型。 (請始終記住,整個數據集上的訓練錯誤不能很好地估計看不見的數據上的錯誤。)

相關問題