2

精確實施隨機森林的在審查原Breiman(2001)紙以及一些其他董事會的職位,我與使用WEKAs隨機森林實施的實際過程稍有困惑。沒有一個來源足夠詳盡,許多甚至相互矛盾。在Weka的3.7

它是如何具體工作,這步驟進行?

我的理解至今:

  • 對於每個樹爲訓練數據被創建
  • 只有定義大小的可用功能的隨機子集相同大小的引導樣品(參數可以在WEKA中選擇)被考慮用於每個節點
  • 關於使用的基礎樹學習器,我發現2006年的一篇文章說明是一個修改過的REPTree。
  • 樹是完全成長,不修剪。
  • 多數票應用(在精度,性能指標的情況下)

我的問題:

  • 實際使用的引導取樣?
  • REPTree仍在使用中或者自那以後算法發生了變化?

澄清這些問題將幫助了我很多!

回答

3

回答您的問題

  1. 套袋(引導聚集)確實使用。您可以查看在代碼上線529

  2. 看來,RandomTree使用,對行看到530

此信息是從Weka的3.7.5,我相信這是正確的一切回到版本3.6.8,但我沒有檢查源代碼。

+0

非常感謝,第一個問題解決了。它的確使用了RandomTree,但問題依然存在於RT的基礎上 - CART或REPTree可能但不是確定的。 – ateich

+0

我不確定你對Java的熟悉程度,但是你可以比較兩個buildTree()方法:[RandomTree](http://grepcode.com/file/repo1.maven.org/maven2/nz.ac.waikato。 cms.weka/weka-dev/3.7.5/weka/classifiers/trees/RandomTree.java#991),[RepTree](http://grepcode.com/file/repo1.maven.org/maven2/nz.ac .waikato.cms.weka/WEKA-dev的/ 3.7.5/WEKA /分類/樹木/ REPTree.java#503)。對我來說,他們看起來非常相似,但我找不到最近的消息來源說他們是一樣的。 – Walter

+0

謝謝我看看。據說它是REPTree的一個稍微修改過的版本。雖然在家裏檢查出來,但在手機屏幕上看不到任何東西。謝謝 – ateich