2013-04-29 54 views
0

這是我遇到的問題。我希望有人能解釋爲什麼R randomForest組合模型 - 錯誤消息

我有我使用的預測分類值大的數據集 - L,M,H - 在原來的data.frame這是一個因素。

訓練集是大的,所以我沒有足夠的內存就可以了訓練 - 所以我把我的訓練數據集的樣本,並創建一個隨機森林。然後,我創建了一個不同的隨機樣本,創建了第二個森林,...。他們都有着相同的性能這是一個問題

我找到了結合功能隨機森林,並決定用它來我的模型結合起來。

然後我需要用新的模式將比分列車設置爲得到一個OOB估計和我的驗證樣本則是相同的。

我對測試集上的預測有問題。

我基本上得到一個消息,說「錯誤的eval(表達式,envirmenclos):對象‘XXX’未找到」,其中XXX是變量名。但這是沒有意義的,因爲變量從未改變名稱

我重複了這幾次,以防萬一我的數據損壞。

任何想法,爲什麼我得到這個?

+0

不可能沒有一個重複的例子說。但總的來說,錯誤信息並不是謊言。如果R說它找不到你的一個變量,那麼它確實無法找到你的一個變量。 – joran 2013-04-29 21:11:00

回答

0

沒有這些數據,是很難知道,但是這是在過去 - 基於類似的錯誤,如果是抽樣數據並運行獨立的模型我的預感,你可能會遇到與分類變量的問題,其中一個因子水平模型與其他模型的因子水平不匹配。可能解決此問題的方法是在運行模型之前在數據框中指定因子水平(使用水平函數)。

編輯 - 一種方式登場在同一樣本數據將它們結合起來,並嘗試應用該模型,看看你得到同樣的錯誤運行兩種模式..

+0

謝謝,尋求幫助 – user1617979 2013-04-30 02:06:39

+0

因素是在數據框架上定義的。問題在於變量名稱,我已經對它們進行了改造,並且我猜想在做同樣的轉換時我沒有那麼小心 – user1617979 2013-04-30 02:08:14