我很想知道是否在監督分類模型(特別是邏輯迴歸)中減少多類分類中的類的數量對於提高準確性有很大的幫助。例如,如果我有10000個樣本的50個類,並且通過將某些類組合在一起,我將類的數量減少到30個。這將顯着提高我的分類模型的準確性嗎?減少分類方法中的類可以提高準確性嗎?
0
A
回答
4
如果你組合的類是相似的,並且有大量的樣本在它們之間錯過分類,它肯定會提高你的性能,因爲它會減少錯誤。
例如:
- 假設正進行分類的4個不同的類別(貓,狗,椅子,桌子)的樣品
- 如果組這類在一起並與未動物clasification執行動物,當一隻貓被錯誤歸類爲狗時(反之亦然),所有發生的分類錯誤都不會再發生,您的總體準確性將會提高。
如果你組的類不相似,它很可能不會提高你的準確性,因爲你不會減少錯誤的數量。想象一下,你的分類器非常好,你不會把任何貓當作狗,反之亦然,在組合這些類時不會減少任何錯誤,因爲沒有。
2
減少類數的效果取決於算法和數據集。一般來說,不能保證減少類別的數量會增加分類的準確性。在很多情況下,情況正好相反 - 增加類的數量可以提高分類的準確性。例如,對於許多數據集,您可以使每個觀察對應一個獨特的類,並以100%的分類準確性結束。這是一個明顯的過度擬合的例子,但是它的目的是增加(而不是減少)類的數量有時可以提高分類的準確性。
相關問題
- 1. 哪個分類器可以提高文本分類的準確性
- 2. 如何提高Matlab中SVM訓練和分類的準確性?
- 3. 提高文章分類器的準確性
- 4. 如何提高樸素貝葉斯分類器的準確性?
- 5. 提高準確性樸素貝葉斯分類器
- 6. 我可以通過減少hdfs塊大小來提高HBase性能嗎?
- 7. 哪種方法可以提高性能?
- 8. 強類型數據集可以提高性能嗎?
- 9. 可以通過模塊/靜態類來提高ASP.NET性能嗎?
- 10. ConvNet:驗證丟失不是強烈減少,但準確性在提高
- 11. 我可以減少通用類的註冊嗎?
- 12. 正確的方法來分類屬性
- 13. 併發性可以提高性能嗎?
- 14. 驗證準確性總是可以和訓練準確度一樣高嗎?
- 15. 我可以將類型分配給MATLAB中的類屬性嗎?
- 16. Bash Rsync:有沒有提高進度條準確性的方法?
- 17. 爲什麼數據增強不能提高CNN紋理分類的準確性?
- 18. 爲什麼不能減少Java子類中方法的可見性?
- 19. 高效的分類方法
- 20. OpenCV - 分類器的測試準確性?
- 21. 增強knn分類器的準確性
- 22. 子類可以影響虛擬方法的可見性嗎?
- 23. 我可以註冊NSNotifications類嗎?我可以在NSNotifications中使用類方法嗎?
- 24. 會減少包含/需要提高性能嗎?
- 25. 如何提高性能分析的準確性
- 26. 蟒蛇調用類的方法,以減少重複
- 27. 分類正確的方法
- 28. 您可以在PHP的類方法中定義類變量嗎?
- 29. 最好的mysql數據類型的空間減少和性能提高
- 30. const-correctness可以提高性能嗎?
事物的分類是_vast_話題。有很多不同的分類方法,您的問題無法正確回答。 – Carsten
@Carsten我要求一個具有Logistic迴歸模型的監督分類模型(多類分類)。我實際上已經嘗試過減少主題,但是從50到45到41,並且我只注意到增加中的小數點差異。所以這個問題讓我感到震驚。 – minks
也許把這個信息放在你的問題中? :) – rbaleksandar