2013-12-23 17 views
0

我正在處理包含1200個屬性和450個實例的監督數據。 爲了獲得良好的準確性,我嘗試了很多決定樹,但沒有一個給了我最好的解決方案,因爲ADtree(交替決策樹)給了我。我可以在監督數據上使用ADtree嗎?

的問題是,ADtree使用Boosting算法,並從我undestanding這些算法都沒有那麼好,因爲他們可以在訓練和測試導致重複insances ..

我的工作是需要被驗證(通過交叉驗證),我不確定我能否使用ADtree。

我的問題是:我可以使用這棵樹嗎?

+1

我不太清楚你的意思是「使用Boosting算法,並且從我認爲這些算法不太好,因爲它們會在列車和測試中導致重複的感應。 – AdrienNK

回答

2

的問題是,ADtree使用Boosting算法

ADtrees沒有增強算法,不使用增壓。如果實施支持加權數據點,則可以將提升應用於ADtrees。

從我undestanding這些算法都沒有那麼好,因爲他們可以在訓練和測試

你的理解是完全錯誤的,不準確的遠程複製造成insances。

我的工作需要驗證(通過交叉驗證),我不確定我能否使用ADtree。

如果你明白交叉驗證,你在做什麼,這顯然是好的。問題是從來沒有「我可以在交叉驗證中使用這個模型」,而是「交叉驗證對我的數據有效嗎?」

我的問題是:我可以使用這棵樹嗎?

是的,但是您顯然需要在盲目嘗試解決問題之前瞭解更多關於您正在做的事情。 Coursera has a fine online introduction

+0

我搜索了Coursera並沒有找到關於AD樹的任何信息,你有沒有看到? –

+0

此問題是您似乎無法理解任何機器學習。沒有理由期望你可以真正理解任何單一算法,而不必從該領域的基礎開始。由於AD樹不受歡迎,因此您將主要在引入AD樹的論文中找到重要信息。再次,在你真正嘗試閱讀論文之前,你首先需要基礎理解。 –