0

如果我們有K類,我必須繪製K個學習曲線嗎? 因爲我似乎不可能一次計算所有K theta向量的列車/驗證錯誤。爲了闡明,學習曲線是交叉驗證/測試集錯誤/成本vs訓練集大小的訓練圖。該圖應該允許您查看增加訓練集大小是否可以提高性能。更一般地說,學習曲線允許您確定算法是否存在偏差(擬合下)或方差(過擬合)問題。我應該爲多類邏輯迴歸分類器繪製多少條學習曲線?

回答

0

這取決於。學習曲線不關心類的數量。就像你說的那樣,這是一個訓練集和測試集錯誤的圖,其中錯誤是一個數值。這是所有的學習曲線。

該錯誤可以是任何你想要的:準確度,精確度,回憶,F1得分等(甚至MAE,MSE和其他迴歸)。

但是,您選擇使用的錯誤是適用於或不適用於您的特定問題的錯誤,這反過來間接影響了您應該如何使用學習曲線。

任何數量的類的準確性都很好定義,所以如果使用這種方法,一個圖就足夠了。

但是,精確度和召回率僅限於二元問題。通過考慮類別爲xnot x的二元問題,您可以稍微推廣它們(例如,參見here),每個類別爲x。在這種情況下,您可能需要繪製每個班級的學習曲線。這也將幫助您更好地發現與某些類別相關的問題。

如果您想了解更多關於性能指標的信息,我很喜歡this paper

+0

嗯我明白了,非常感謝您的幫助! –