0
A
回答
1
這很大程度上取決於您的迴歸算法。對於基於內核的迴歸算法來說,好的特性對於線性分類器可能相當不利。 (https://en.wikipedia.org/wiki/Feature_selection) 您似乎瞄準了「過濾方法」。在許多回歸設置中很好用的是Pearson Correlation。這在ML-Lib中也是可用的。
但是,你應該考慮到不加K個頂部相關功能,但
- 避免選擇對高相關的功能。所以你必須建立所有特徵對之間的相關矩陣。
- 選擇頂級特徵,構建迴歸模型,測量模型的誤差,測量誤差與其餘特徵之間的相關性。這將貪婪地選擇最佳功能
- 一旦你選擇了你的功能,你應該考慮做一個靈敏度分析。這就是爲所有功能建立一個迴歸模型,併爲所有功能已被刪除的功能集建立迴歸模型。如果刪除沒有顯着影響,您可以刪除它。
相關問題
- 1. 處理迴歸(機器學習)中的分類特徵的未分配(空)值?
- 2. 機器學習 - 分類器評估
- 3. 評分預測(Python的機器學習)
- 4. 評估線性迴歸(在Microsoft機器學習
- 5. 如何輸出特徵向量機器學習分類算法
- 6. 高斯NB機器學習 - 特徵分析
- 7. SVM機器學習:LibSVM中的特徵表示
- 8. Scikit學習:預測分類特徵
- 9. 特徵選擇(機器學習)的包裝方法在Scikit學習
- 10. 特徵選擇Scikit學習
- 11. 少數樣本和特徵的機器學習算法
- 12. 機器學習 - 圖像的特徵設計
- 13. 學習遞歸Java
- 14. scikit學習(sklearn)中的特徵如何排在RFECV中?
- 15. 機器學習-svm特徵融合技術
- 16. 機器學習 - 特徵選擇和訓練數據
- 17. Azure機器學習分類
- 18. 機器學習算法評估
- 19. 在迴歸(機器學習)中處理未分配(空)的要素值?
- 20. 什麼機器歸納偏置學習
- 21. 機器學習的挑戰:在Java/Groovy中(數據挖掘,機器學習)
- 22. 標準化對線性迴歸的影響:機器學習
- 23. 如何培養在機器的連續輸出(迴歸)學習
- 24. Bot中的機器學習
- 25. GATE中的機器學習
- 26. 特徵預處理scikit學習
- 27. 如何分辨機器學習模型的學習型
- 28. Python機器學習準確性評分與意見
- 29. 機器學習算法與健身評分
- 30. 支持向量機迴歸學習器Matlab
感謝您的詳細回覆。我目前的目標僅限於查找功能的排名。我正在使用線性SVR進行迴歸。我需要知道是否有一些基於Java的實現可以輕鬆實現基於過濾器的方法。 – Sumit
是的Weka。 Weka爲機器學習提供variouse算法。 http://weka.sourceforge.net/doc.dev/weka/attributeSelection/CorrelationAttributeEval.html (我把ML-Lib和http://spark.apache.org/mllib/混淆了) – CAFEBABE