我試圖解決一個二進制分類問題,其中80%的數據屬於類x和20%的數據屬於類y。我的所有模型(AdaBoost,神經網絡和SVC)都預測所有數據都是類x的一部分,因爲這是他們可以達到的最高精度。機器學習:移動Treshhold
我的目標是爲類x的所有條目實現更高的精度,我不在乎有多少條目被錯誤地歸類爲類y的一部分。
我的想法是將模型中的條目放入類x中,然後將其放入類y中。
我該怎麼做到這一點?有沒有辦法移動閾值,以便只有非常明顯的條目被歸類爲類x?
我使用Python和sklearn
示例代碼:
adaboost = AdaBoostClassifier(random_state=1)
adaboost.fit(X_train, y_train)
adaboost_prediction = adaboost.predict(X_test)
confusion_matrix(adaboost_prediction,y_test) outputs:
array([[ 0, 0],
[10845, 51591]])