我想選擇可用的最佳功能子集,以區分兩個要加入到我構建的統計框架中的類,其中功能不是獨立的。選擇功能的最佳子集
看過機器學習中的功能選擇方法後,它似乎分爲三個不同的類別:過濾器,包裝器和嵌入式方法。過濾方法可以是:單變量或多變量。使用Filter(多變量)或包裝器方法確實有意義,因爲兩個 - 據我瞭解 - 尋找最佳子集,但是,因爲我沒有使用分類器,所以如何使用它?
是否有意義應用這樣的方法(例如遞歸功能 消除)到DT或隨機森林分類,其中 有規則在那裏,然後特徵拿得到最好的子集,並餵它 到我的框架?**
而且,因爲大多數提供的算法Scikit學習是 單變量算法,是否有任何其他基於Python的庫 提供更多的子集的特徵選擇算法?
非常感謝,這是真正有用的......那麼,這是否意味着我可以確實使用分類器來確定特徵選擇步驟中的重要特徵,然後使用此重要特徵將其饋送到另一個框架(與特徵選擇步驟中使用的分類器不同)? – Ophilia
我不明白爲什麼不。分類器都是關於如何利用X數據來清除y數據中所需的輸出信號。他們都需要找到哪些信息在某種程度上實際上是信息性的(vs噪聲)。分類器可能不同意信號中重要的內容,但作爲特徵選擇步驟應該沒問題。 – Erotemic
非常感謝!這真的很有幫助 – Ophilia