我擁有文檔術語數據,其中的術語以維度表示。我必須對術語進行特徵選擇,我打算使用「互信息」作爲執行特徵選擇的措施。我的疑問是,在計算所有可能的配對之間的相互信息之後,我們應該做什麼? 我應該設置一個閾值並選擇落入閾值範圍內的所有對的條款嗎?功能選擇
Q
功能選擇
0
A
回答
1
如果你想使用互信息,你可以考慮使用mRMR algrorithm。您可以使用此類算法來選擇要素。我的意思:
You have n features at your data set (it means n dimensions)
如果你想使用最有意義的
k of n (k < n)
您可以使用(使用互信息的背景即與MRMR)特徵選擇
決定ķ依賴在某些情況下。
其中之一是你不想在你的 模型創建中使用不必要的功能。
另一件事是要aviod計算成本,並從數據中刪除一些 功能設置
你刪除了一些功能後,您應該測試你的算法。你檢查精度是否提高,並根據你的目標,即使精度下降,從而避免計算成本(所以你可能想要放棄一些功能)
另一方面,我建議你看功能提取方法,即PCA和LDA(尤其適合您的情況)。
+0
mRMR需要在手之前知道類(監督)。什麼樣的方法應該用於特徵選擇時不知道類標籤? – pooja 2013-03-07 09:34:00
相關問題
- 1. 功能選擇中選擇
- 2. 選擇功能
- 3. 功能選擇
- 4. 功能選擇
- 5. Matlab功能選擇
- 6. 功能在選擇
- 7. jQuery選擇功能
- 8. Xpath選擇功能?
- 9. JavaScript選擇功能
- 10. Adaboost功能選擇
- 11. Wix3(可選)選擇功能
- 12. 功能選擇功能外使用
- 13. Oracle。選擇和功能
- 14. SQL選擇帶有功能
- 15. 應用功能來選擇
- 16. POSTGRESQL - 功能選擇+更新
- 17. JavaScript - 用戶選擇功能
- 18. 選擇從範圍功能
- 19. Weka功能選擇(InfoGainAttributeEval,ChiSquaredAttributeEval)
- 20. 的InstallShield:當功能選擇
- 21. Openlayers 3 + GeoJson選擇功能
- 22. 選擇功能控制OpenLayers
- 23. 將選擇哪個功能?
- 24. 選擇Radiobutton做功能
- 25. 選擇內容到功能
- 26. 數據表選擇功能
- 27. VB.Net Datatable選擇MID功能
- 28. 隨機選擇功能
- 29. 使用cucmber選擇功能
- 30. 的Python:選擇功能
是的,這是通常會做的事情。 – 2013-03-06 09:24:38
謝謝@LarsKotthoff你能告訴我們什麼基礎上我們可以決定的門檻? – pooja 2013-03-06 10:17:58
取決於您的具體數據以及您想保留多少功能。理想情況下,您會發現突然發生重大變化,從幾乎沒有互信息到大量相互信息,這些信息會告訴您在哪裏放置閾值。實際上,情況可能並非如此。 – 2013-03-06 10:19:34