2017-08-02 22 views

回答

0

有幾種方法可以將數據擬合到模型中,並根據擬合將最相關的特徵與較不相關的特徵進行分類。如果你想知道更多隻是谷歌功能選擇。

我不知道你正在使用,但這裏的語言是關於它的蟒蛇頁面的鏈接: http://scikit-learn.org/stable/modules/feature_selection.html

您可以使用此功能:

http://scikit-learn.org/stable/modules/generated/sklearn.feature_selection.RFE.html#sklearn.feature_selection.RFE

這將消除基於分類器擬合的數據集中較少有​​意義的特徵,您可以選擇例如邏輯迴歸或SVM,然後選擇要離開的特徵。

我認爲最好的方法的選擇取決於數據,所以更多的信息是必要的。

+0

你能告訴我們如何基於樹的建模算法,如XGBoost自動進行特徵選擇? –

+0

是的,通常基於樹的方法能夠做到這一點。在這裏查看示例:http://machinelearningmastery.com/feature-importance-and-feature-selection-with-xgboost-in-python/ –