如何使用具有觀察權重的R randomForest
包?我知道這個包裏沒有這個選項。我有2個問題:在randomForest包中包含觀察權重
使用
randomForest
包有沒有解決這個問題的方法?這時我畫從數據樣本權重的概率,所以我至少可以模擬它:m = dim(data)[1] sample(data, m, replace=TRUE, prob=weights)
它的工作原理有其他(更好的)解決方案?
是否有任何替代
randomForest
包。我發現了party
包(cforest),但是在內存管理方面它很糟糕(或者我無法像使用randomForest
包那樣使用它)。我有大約20萬觀察值和30-40個變量。
編輯:
對不起,不澄清細節。我正在使用randomForest
包進行迴歸問題(不分類)。這是一個時間序列,每個觀察都有其重要性。稍後,該權重用於確定跨測試觀察的模型性能。 y變量是連續的。
可能會發現http://stats.stackexchange.com – 2014-03-21 17:45:14