2
精確實施隨機森林的在審查原Breiman(2001)紙以及一些其他董事會的職位,我與使用WEKAs隨機森林實施的實際過程稍有困惑。沒有一個來源足夠詳盡,許多甚至相互矛盾。在Weka的3.7
它是如何具體工作,這步驟進行?
我的理解至今:
- 對於每個樹爲訓練數據被創建
- 只有定義大小的可用功能的隨機子集相同大小的引導樣品(參數可以在WEKA中選擇)被考慮用於每個節點
- 關於使用的基礎樹學習器,我發現2006年的一篇文章說明是一個修改過的REPTree。
- 樹是完全成長,不修剪。
- 多數票應用(在精度,性能指標的情況下)
我的問題:
- 實際使用的引導取樣?
- REPTree仍在使用中或者自那以後算法發生了變化?
澄清這些問題將幫助了我很多!
非常感謝,第一個問題解決了。它的確使用了RandomTree,但問題依然存在於RT的基礎上 - CART或REPTree可能但不是確定的。 – ateich
我不確定你對Java的熟悉程度,但是你可以比較兩個buildTree()方法:[RandomTree](http://grepcode.com/file/repo1.maven.org/maven2/nz.ac.waikato。 cms.weka/weka-dev/3.7.5/weka/classifiers/trees/RandomTree.java#991),[RepTree](http://grepcode.com/file/repo1.maven.org/maven2/nz.ac .waikato.cms.weka/WEKA-dev的/ 3.7.5/WEKA /分類/樹木/ REPTree.java#503)。對我來說,他們看起來非常相似,但我找不到最近的消息來源說他們是一樣的。 – Walter
謝謝我看看。據說它是REPTree的一個稍微修改過的版本。雖然在家裏檢查出來,但在手機屏幕上看不到任何東西。謝謝 – ateich