2016-02-09 36 views
0

我很想知道是否在監督分類模型(特別是邏輯迴歸)中減少多類分類中的類的數量對於提高準確性有很大的幫助。例如,如果我有10000個樣本的50個類,並且通過將某些類組合在一起,我將類的數量減少到30個。這將顯着提高我的分類模型的準確性嗎?減少分類方法中的類可以提高準確性嗎?

+1

事物的分類是_vast_話題。有很多不同的分類方法,您的問題無法正確回答。 – Carsten

+0

@Carsten我要求一個具有Logistic迴歸模型的監督分類模型(多類分類)。我實際上已經嘗試過減少主題,但是從50到45到41,並且我只注意到增加中的小數點差異。所以這個問題讓我感到震驚。 – minks

+0

也許把這個信息放在你的問題中? :) – rbaleksandar

回答

4

如果你組合的類是相似的,並且有大量的樣本在它們之間錯過分類,它肯定會提高你的性能,因爲它會減少錯誤。

例如:

  • 假設正進行分類的4個不同的類別(貓,狗,椅子,桌子)的樣品
  • 如果組這類在一起並與未動物clasification執行動物,當一隻貓被錯誤歸類爲狗時(反之亦然),所有發生的分類錯誤都不會再發生,您的總體準確性將會提高。

如果你組的類不相似,它很可能不會提高你的準確性,因爲你不會減少錯誤的數量。想象一下,你的分類器非常好,你不會把任何貓當作狗,反之亦然,在組合這些類時不會減少任何錯誤,因爲沒有。

2

減少類數的效果取決於算法和數據集。一般來說,不能保證減少類別的數量會增加分類的準確性。在很多情況下,情況正好相反 - 增加類的數量可以提高分類的準確性。例如,對於許多數據集,您可以使每個觀察對應一個獨特的類,並以100%的分類準確性結束。這是一個明顯的過度擬合的例子,但是它的目的是增加(而不是減少)類的數量有時可以提高分類的準確性。

相關問題