2011-02-17 19 views
3

我幾個月來一直在爲weka工作。 目前,我正在Ostfold大學學院學習機器學習課程。 我需要一個更好的方法來構建基於分離的訓練和測試集的決策樹。任何人想出好主意都可以得到很大的解脫。 Thanx提前。培訓和測試套件在構建決策樹中的作用並將其用於分類

-Neo

+0

比什麼好?你使用什麼方法?你到目前爲止做了什麼? – Terrance 2011-02-17 20:30:02

回答

4

你可能會問更具體的東西,但總的來說:

您建立與訓練集決策樹,並且您評估使用測試集樹的性能。換句話說,在測試數據上,您可以調用一個通常命名爲類似c * lassify *的函數,傳入新構建的樹和要分類的數據點(在您的測試集中)。

該函數返回數據點所屬的樹中的葉(終端)節點 - 並假定該葉的內容是同類的(填充單個類中的數據,而不是混合物),那麼您有實質上爲該數據點分配了一個類標籤。當您將樹所分配的類標籤與數據點的實際類標籤進行比較並重複測試集中的所有實例時,您有一個度量標準來評估樹的性能。

經驗法則:洗牌您的數據,然後分配90%的訓練集,其他10%的測試集。