我的模型拋出了學習曲線,如下所示。這些好嗎?我是一名初學者,在整個互聯網上我都看到,隨着訓練實例的增加,訓練分數應該會下降然後收斂。但是這裏的訓練分數正在增加,然後收斂。因此,我想知道這是否表示我的代碼中有錯誤/輸入有問題?關於學習曲線的具體形狀
好吧我想通了我的代碼有什麼問題。
train_sizes , train_accuracy , cv_accuracy = lc(linear_model.LogisticRegression(solver='lbfgs',penalty='l2',multi_class='ovr'),trainData,multiclass_response_train,train_sizes=np.array([0.1,0.33,0.5,0.66,1.0]),cv=5)
我還沒有輸入Logistic迴歸的正則化參數。
但現在,
train_sizes , train_accuracy , cv_accuracy = lc(linear_model.LogisticRegression(C=1000,solver='lbfgs',penalty='l2',multi_class='ovr'),trainData,multiclass_response_train,train_sizes=np.array([0.1,0.33,0.5,0.66,1.0]),cv=5)
學習曲線看起來沒事。
有人可以告訴我爲什麼這樣嗎?即使用默認的註冊期限,訓練分數增加,而註冊分數降低?
數據詳細信息:10課。圖片大小不一。 (數字分類 - 街景數字)
我懷疑你的問題與你正在使用的數據有關。你能描述你的數據嗎?多少班?每班多少人?我可以想象,也許你的數據分裂的方式很難學習一個好的模型來區分所有的類。 – NBartley
@NBartley請檢查編輯後的問題。謝謝! – MLnoob
您是否多次運行此代碼?每次都有這種情況嗎? – NBartley