2012-11-07 103 views
1

我想用R randomForest做一個多標籤分類。 我有十個班A..J,R中的隨機森林 - 很多類

我發現的例子如何預測一個類,如:

r = randomForest(J ~., data=train, importance=TRUE, do.trace=100) 

但我想預測更多的類,例如H,I,J。 (即說只有A..G被賦予屬性)。 我該怎麼辦?

我有一個想法,保留A..G和只有一個預測類(H/I/J)和運行randomForest 3次,但也許有更好的方法?在一次運行中做到這一點?

非常感謝提前。

+1

你的問題可能會更清晰。你是否說你想要預測訓練數據中不存在的課程?因爲那會很困難。 – joran

+0

不,我的意思是我想把7列作爲給定值,並預測其他3列的值。 – user1804773

+0

我不知道一個多元RF包的(可能是錯誤的,雖然...)。容易的事情是適合三個模型。 – joran

回答

1

假設所有屬性H,I和J都是二元的。然後,你可以預測一個新的屬性K的2^3個可能的值,然後將結果解碼成3個屬性:

  • 1 - > 0,0,0
  • 2 - > 0,0,1
  • 3 - > 0,1,0
  • 4 - > 0,1,1
  • 5 - > 1,0,0
  • 6 - > 1,0,1
  • 7 - > 1,1,0
  • 8 - > 1,1,1