-2
Q
/培訓效果導致
A
回答
1
分割你的整個數據集分成訓練和測試的一點是,你要學會(樸素貝葉斯或其他方式)的模型應該反映因果(功能和預測),而不是簡單的數據之間的真實關係。例如,你總是可以對許多數據點完美地擬合一條曲線,但這樣做可能會使它對你想要做的預測毫無用處。
通過使用單獨的測試集,在未看到的數據上測試了學習模型。理想情況下,訓練和測試集中的錯誤(或者您測量的任何內容)大致相同,這表明您的模型是相當一般的,而不是過度訓練數據。
如果你的情況,降低訓練集的大小對測試集提高性能,它表明,學習模式太具體,不能一概而論。但是,不應該改變訓練/測試分割,而應該調整學習者的參數。您可能還想考慮使用cross validation而不是簡單的培訓/測試拆分,因爲它會提供更可靠的性能估計。
相關問題
- 1. tf.estimator的分佈式培訓導致更多的培訓步驟
- 2. 從秧雞培訓和java培訓發散結果
- 3. TensorFlow培訓
- 4. JBoss Seam培訓
- 5. DNN CMS培訓
- 6. NLTK NaiveBayesClassifier培訓
- 7. Sharepoint培訓
- 8. 在線培訓
- 9. 通過培訓獲得更好的識別效果tesseract
- 10. 隱藏導航欄 - Android培訓
- 11. 創建培訓網頁嚮導
- 12. TensorFlow培訓圖片
- 13. LibSVM培訓錯誤
- 14. Azure培訓套件
- 15. 再培訓以來
- 16. 最佳PHP培訓?
- 17. sklearn.neural_network.BernoulliRBM在線培訓?
- 18. Tokenizer培訓與StanfordNLP
- 19. jQuery培訓視頻
- 20. OpenCV培訓輸出
- 21. 培訓與Matlab中
- 22. MySQL培訓視頻
- 23. MNIST - 培訓卡住
- 24. Tensorflow Slim Imagenet培訓
- 25. Visual Studio 2008培訓
- 26. 培訓RBF網絡
- 27. CCD vs CDA培訓
- 28. 上一批培訓
- 29. SVM培訓性能
- 30. Tesseract培訓問題