減少分類方法中的類可以提高準確性嗎？

我很想知道是否在監督分類模型（特別是邏輯迴歸）中減少多類分類中的類的數量對於提高準確性有很大的幫助。例如，如果我有10000個樣本的50個類，並且通過將某些類組合在一起，我將類的數量減少到30個。這將顯着提高我的分類模型的準確性嗎？減少分類方法中的類可以提高準確性嗎？

來源

2016-02-09 minks

事物的分類是_vast_話題。有很多不同的分類方法，您的問題無法正確回答。 – Carsten

@Carsten我要求一個具有Logistic迴歸模型的監督分類模型（多類分類）。我實際上已經嘗試過減少主題，但是從50到45到41，並且我只注意到增加中的小數點差異。所以這個問題讓我感到震驚。 – minks

也許把這個信息放在你的問題中？ :) – rbaleksandar

如果你組合的類是相似的，並且有大量的樣本在它們之間錯過分類，它肯定會提高你的性能，因爲它會減少錯誤。

例如：

假設正進行分類的4個不同的類別（貓，狗，椅子，桌子）的樣品
如果組這類在一起並與未動物clasification執行動物，當一隻貓被錯誤歸類爲狗時（反之亦然），所有發生的分類錯誤都不會再發生，您的總體準確性將會提高。

如果你組的類不相似，它很可能不會提高你的準確性，因爲你不會減少錯誤的數量。想象一下，你的分類器非常好，你不會把任何貓當作狗，反之亦然，在組合這些類時不會減少任何錯誤，因爲沒有。

來源

2016-02-09 17:05:52 gcucurull

減少類數的效果取決於算法和數據集。一般來說，不能保證減少類別的數量會增加分類的準確性。在很多情況下，情況正好相反 - 增加類的數量可以提高分類的準確性。例如，對於許多數據集，您可以使每個觀察對應一個獨特的類，並以100％的分類準確性結束。這是一個明顯的過度擬合的例子，但是它的目的是增加（而不是減少）類的數量有時可以提高分類的準確性。

來源

2016-02-09 18:40:12 bogatron

減少分類方法中的類可以提高準確性嗎？

回答

相關問題