有沒有辦法檢索用於訓練分類器的特徵名稱列表,一旦已經使用fit
方法進行了訓練?我希望在應用不可見的數據之前獲取這些信息。 用於訓練的數據是熊貓DataFrame
,在我的情況下,分類器是RandomForestClassifier
。從分類器中檢索訓練特徵名稱列表
0
A
回答
1
根據文檔和以前的經驗,無法獲得至少在其中一個拆分處考慮的功能列表。
您是否擔心您不希望將所有功能用於預測,而只是實際用於培訓的功能?在這種情況下,我建議在擬合後列出feature_importances_
,並消除看似不相關的功能。然後訓練一個只有相關特徵的新模型,並將這些特徵用於預測。
1
您不需要知道爲培訓選擇了哪些功能。在預測步驟中,請確保在學習階段期間使用相同功能。
隨機森林分類器將只使用它進行拆分的功能。這些將與第一階段學到的相同。其他人不會考慮。
如果形狀您測試數據的是不一樣的訓練數據它會拋出一個錯誤,即使測試數據包含用於您決策樹的分裂的所有功能。
因爲隨機森林做出的特點隨機選擇的決策樹(稱爲estimators
在sklearn
)的所有功能很可能是至少使用一次更重要的是,。
然而,如果你想知道使用的功能,你可以調用屬性n_features_
和feature_importances_
您分類一次安裝。
你可以看看here看看你如何檢索你使用的最重要的功能的名稱。
相關問題
- 1. 使用SIFT特徵訓練SVM分類器
- 2. 特徵提取訓練
- 3. 如何獲得經過訓練的LDA分類器的特徵權重
- 4. 連接SURF特徵和氡特徵來訓練SVM
- 5. 機器學習 - 特徵選擇和訓練數據
- 6. Haar級聯分類器訓練問題
- 7. OpenCV:訓練級聯分類器
- 8. 訓練分類器的時間
- 9. Accord.NET:如何訓練Boost分類器
- 10. 重新訓練traincascade分類器opencv?
- 11. 如何增量訓練nltk分類器
- 12. Tensorflow線性分類器未訓練
- 13. 訓練我們自己的分類器
- 14. nltk貝葉斯分類器訓練
- 15. 貝葉斯分類器訓練集
- 16. 如何使用附加的分類/數字特徵來訓練CNN模型?
- 17. NLTK使用訓練分類
- 18. Tensorflow分類圖像訓練
- 19. 訓練分類模型Opennlp
- 20. 預分類訓練的推特評論分類
- 21. 如何使用列表功能列表來訓練分類器Python
- 22. 使用SVM-light訓練分類器用於物體檢測
- 23. 分類特徵
- 24. 適合後檢索訓練數據
- 25. 在SQLite中檢索表列名稱
- 26. 從類名中檢索控制器名稱
- 27. Tensorflow python分類訓練與子類別
- 28. 用於二進制分類的訓練多級分類器
- 29. 從數據庫表中檢索主鍵,標識列和特定名稱列
- 30. SQLite - 從表中檢索一組名稱
您建議的解決方案只返回功能的數量而不返回它們的名稱。我知道在預測階段,不需要提供名稱,但只需提供相同的功能。但是,就我而言,我並不知道培訓中選擇的功能是什麼(如果這一點很重要的話,還有專欄順序)。 – user6903745
@ user6903745:您爲什麼想知道選擇用於培訓的功能? – MMF
我正在創建一個函數,它將一個分類器作爲參數。爲了不硬編碼我先前可能不知道的變量列表,或避免輸入錯誤或只是輸入無窮無盡的變量列表,最好將它存儲在分類器本身中。 – user6903745