2015-10-21 131 views
0

我想用sklearn.learning_curve繪製我的SVC分類器的學習曲線。從情節中,我發現我的訓練分數和測試分數都同時增加。但隨着樣本數量的增加,訓練曲線和交叉驗證曲線之間的差距變大。據我所知,當提供更多樣本時,培訓分數應該會下降。你們對這個問題有任何意識嗎?關於學習曲線

+0

你是說你的訓練集的分數在每次迭代或測試集上都會增加?在第二種情況下一切正常。 –

+0

這是在我的訓練集上。 – weipengHU

+0

它不應該這樣做。添加您的代碼,您可以使用它訓練和繪製曲線,也可能是代碼中的錯誤。 –

回答

0

如果訓練和交叉驗證準確度之間的差距在增加,那麼這表示您的模型過度擬合了訓練數據。每次迭代(提供額外的訓練數據),你的模型能夠更好地捕捉訓練數據,但是它不再能夠更好地推廣(並且因此交叉驗證準確性收斂)。

+0

爲我遲到的回覆道歉。但是,在對參數進行了一些修改之後,曲線現在開始上升並最終收斂,這是常見情況嗎? – weipengHU

+0

這是一種常見的模式,可以觀察到確切 – Sjoerd

+0

好的,非常感謝:-D – weipengHU