Q

使用機器學習的數據集中的功能的重要性？

machine-learning

2017-08-02 22 views 0 likes

0

我們如何使用機器學習來計算數據集中要素的重要性？哪種算法會更好，爲什麼？使用機器學習的數據集中的功能的重要性？

2017-08-02 Ashok Lathwal

A

回答

0

有幾種方法可以將數據擬合到模型中，並根據擬合將最相關的特徵與較不相關的特徵進行分類。如果你想知道更多隻是谷歌功能選擇。

我不知道你正在使用，但這裏的語言是關於它的蟒蛇頁面的鏈接： http://scikit-learn.org/stable/modules/feature_selection.html

您可以使用此功能：

http://scikit-learn.org/stable/modules/generated/sklearn.feature_selection.RFE.html#sklearn.feature_selection.RFE

這將消除基於分類器擬合的數據集中較少有意義的特徵，您可以選擇例如邏輯迴歸或SVM，然後選擇要離開的特徵。

我認爲最好的方法的選擇取決於數據，所以更多的信息是必要的。

2017-08-02 07:20:57

+0

你能告訴我們如何基於樹的建模算法，如XGBoost自動進行特徵選擇？ –

+0

是的，通常基於樹的方法能夠做到這一點。在這裏查看示例：http://machinelearningmastery.com/feature-importance-and-feature-selection-with-xgboost-in-python/ –

相關問題