2017-03-17 66 views
1

我試圖預測一個值。我能夠預測何時使用我的實際目標值,這是幾天,但我嘗試預測使用該值的日誌,這給我一個錯誤。我正在使用sklearn和隨機森林。使用隨機森林中的日誌時出錯Python

代碼:

X = final_pressure_df.drop(['y', 'log_y', 'patient_id', 'wound_id'], axis=1) 
Y = final_pressure_df['log_y'] 

X_train, X_test, Y_train, Y_test = sklearn.cross_validation.train_test_split(X, Y, test_size=0.4, random_state=5) 

forest = RandomForestClassifier(criterion='entropy', n_estimators=200, max_depth=100, random_state=5) 

forest.fit(X_train, Y_train) 

錯誤:ValueError: Unknown label type: array([[ 3.91202301]

有人能幫助我嗎?

回答

0

您需要回歸而不是分類,因此請使用RandomForestRegressor。 當預測的變量是實值(浮點)時,分類將不起作用。即使在第一種情況下,當您預測天數時,使用迴歸仍然更有意義,因爲您預測的是某個值,以及不是類/類別的天數。

+0

非常感謝,我走了試試! – bim1