在Weka的3.7

精確實施隨機森林的在審查原Breiman（2001）紙以及一些其他董事會的職位，我與使用WEKAs隨機森林實施的實際過程稍有困惑。沒有一個來源足夠詳盡，許多甚至相互矛盾。在Weka的3.7

它是如何具體工作，這步驟進行？

我的理解至今：

對於每個樹爲訓練數據被創建
只有定義大小的可用功能的隨機子集相同大小的引導樣品（參數可以在WEKA中選擇）被考慮用於每個節點
關於使用的基礎樹學習器，我發現2006年的一篇文章說明是一個修改過的REPTree。
樹是完全成長，不修剪。
多數票應用（在精度，性能指標的情況下）

我的問題：

實際使用的引導取樣？
REPTree仍在使用中或者自那以後算法發生了變化？

澄清這些問題將幫助了我很多！

來源

2013-10-02 ateich

回答您的問題

套袋（引導聚集）確實使用。您可以查看在代碼上線529
看來，RandomTree使用，對行看到530

此信息是從Weka的3.7.5，我相信這是正確的一切回到版本3.6.8，但我沒有檢查源代碼。

來源

2013-10-02 15:01:50 Walter

非常感謝，第一個問題解決了。它的確使用了RandomTree，但問題依然存在於RT的基礎上 - CART或REPTree可能但不是確定的。 – ateich

我不確定你對Java的熟悉程度，但是你可以比較兩個buildTree（）方法：[RandomTree]（http://grepcode.com/file/repo1.maven.org/maven2/nz.ac.waikato。 cms.weka/weka-dev/3.7.5/weka/classifiers/trees/RandomTree.java＃991），[RepTree]（http://grepcode.com/file/repo1.maven.org/maven2/nz.ac .waikato.cms.weka/WEKA-dev的/ 3.7.5/WEKA /分類/樹木/ REPTree.java＃503）。對我來說，他們看起來非常相似，但我找不到最近的消息來源說他們是一樣的。 – Walter

謝謝我看看。據說它是REPTree的一個稍微修改過的版本。雖然在家裏檢查出來，但在手機屏幕上看不到任何東西。謝謝 – ateich

回答

相關問題