回答
當然,是的,因爲如果它是一個隨機樣本,它代表數據中的基本分佈,它告訴您這個特定值具有更高的概率。刪除重複數據只會使數據集變得毫無用處。
但是在使用兩個類進行簡單分類的情況下(例如,Yes \ No),錯誤重複是否有意義?例如,'0 0 255'顯然不是膚色。我認爲在200重複它沒有意義:) – MrPisarik
我認爲這是依賴於使用的分類器類型 – MrPisarik
這是一個不同的問題:數據是否有效? – latorrefabian
這很重要。例如:如果行'a'在數據中出現5次,而另一行'b'只出現一次,那麼您希望將行'a'分類好於'b',因爲當您計算成本函數行'a'會出現更多的時間,並對成本有更大的影響。
而且,如果你的訓練很好地代表了測試數據,那麼行'a'出現的次數就會高於行'b'的次數。
- 1. 數據集有重複記錄
- 2. 打印重複數據集
- 3. 如何合併重複數據集值到單個數據集
- 4. Apache Ignite-Cassandra集成,數據重複?
- 5. 數據集中的重複列
- 6. 重複整個數據集的功能
- 7. 從數據集中刪除重複值
- 8. NHibernate集合獲取,重複數據
- 9. django重複數據有時
- 10. 具有重複名稱的數據子集
- 11. 子集R數據框或有關重複變量的值
- 12. 如果數據集有行嗎?
- 13. 重複數據
- 14. 重複數據
- 15. 設置的重複數據集在SAS數據步
- 16. PostgreSQL中有大型二進制數據的重複數據刪除嗎?
- 17. 重塑數據集
- 18. 如何重複或複製數據集中的唯一行?
- 19. SSRS - 在多個數據集中重複使用臨時表
- 20. 使用相同的數據重複訓練集
- 21. 使用group by subquery重複數據刪除記錄集
- 22. 使用t-sql選擇刪除重複值的數據集
- 23. 如何使用SAS中重複的變量創建數據集
- 24. 使用strptime會導致數據集中的重複日期
- 25. 使用休眠與大數據集重複行
- 26. 使用matplotlib繪製從文件重複數據集並列出
- 27. 如何彙總和重用複雜數據集
- 28. 我應該重複測試參數(例如收集空虛)嗎?
- 29. 我可以保存AR數據以便重複使用嗎?
- 30. 重複數據包
跟Joe Pisarcik有關嗎? – stackoverflowuser2010
@ stackoverflowuser2010,nope – MrPisarik