2014-03-28 86 views
0

我正在使用十折交叉驗證算子。我第一次使用rapidminer,所以有一些混淆,我會得到10個決策樹。我已經讀過所有結果的平均值,因此最終輸出是什麼。所有的平均值?使用交叉驗證的Rapidminer決策樹

回答

0

交叉驗證的目的是輸出一個關於模型在顯示不可見數據時會產生的性能的預測。

對於10折的情況,數據被分成10個分區。有10種可能的方式來獲得9/10的數據來製作訓練集,並且這些可用於構建10個模型。將這些模型應用於剩餘的1個分區以產生性能估計。這10場表演是平均的。最終結果是一個平均值,這是一個合理估計未看到數據的模型的性能。

剩下的問題是模型是什麼?最好的答案是使用建立在所有數據上的模型,並假設它足夠接近用於生成平均估計的10個模型。