0
我們如何使用機器學習來計算數據集中要素的重要性?哪種算法會更好,爲什麼?使用機器學習的數據集中的功能的重要性?
我們如何使用機器學習來計算數據集中要素的重要性?哪種算法會更好,爲什麼?使用機器學習的數據集中的功能的重要性?
有幾種方法可以將數據擬合到模型中,並根據擬合將最相關的特徵與較不相關的特徵進行分類。如果你想知道更多隻是谷歌功能選擇。
我不知道你正在使用,但這裏的語言是關於它的蟒蛇頁面的鏈接: http://scikit-learn.org/stable/modules/feature_selection.html
您可以使用此功能:
這將消除基於分類器擬合的數據集中較少有意義的特徵,您可以選擇例如邏輯迴歸或SVM,然後選擇要離開的特徵。
我認爲最好的方法的選擇取決於數據,所以更多的信息是必要的。
你能告訴我們如何基於樹的建模算法,如XGBoost自動進行特徵選擇? –
是的,通常基於樹的方法能夠做到這一點。在這裏查看示例:http://machinelearningmastery.com/feature-importance-and-feature-selection-with-xgboost-in-python/ –