我試圖適應sklearn載體,但我收到此錯誤:ValueError異常:未知的不支持多類因變量
ValueError: unknown is not supported This is my code:
X = df_features.values
X = X.reshape((len(X),len(df_features.columns)))
Y = df_train['action'].values
Y = Y.reshape((len(Y),))
pipeline = Pipeline([
('clf', RandomForestClassifier())
])
parameters = {
'clf__max_depth': [5,7,9],
'clf__max_features': [3,4,5],
'clf__min_samples_leaf': [3,4,5,6,7],
'clf__bootstrap': [True]
}
score_func = make_scorer(metrics.f1_score,average='weighted')
grid_search = GridSearchCV(pipeline, parameters, n_jobs=3,
verbose=1, scoring=score_func)
grid_search.fit(X, Y)
這是Y採樣數據:
['NOTHING', 'NOTHING', 'SELL', 'SELL', 'NOTHING', 'NOTHING', 'NOTHING']
我該如何解決這個問題?
謝謝
你必須使用二值化到Y二值化,以0和1。如果您上傳您的數據,我可以提供一個示例 – sera
@sera。它不是必需的。 scikit-learn估計器自動處理類標籤的轉換。 –
'Y'的類型是什麼。顯示「type(Y)'。在試穿之前試試'Y = Y.astype('str')'。 –