我遇到了this example,其中涉及完成測試數據集的面部。這裏,max_features
的值32
傳遞給ExtraTreesRegressor()
函數。我瞭解到構建的決策樹會從輸入數據集中選擇隨機特徵。對於上述鏈接的示例,圖像用作列車和測試數據集。 This wiki page描述了各種類型的圖像特徵。現在我無法瞭解哪些功能劑量sklearn.ensemble.ExtraTreeRegressor
尋找或提取作爲輸入提供的圖像數據集來構建隨機森林。另外,如何確定32
的值對於max_features
是最佳值。請幫我解決一下這個。Scikit的ExtraTreeRegressor考慮的功能學習構建隨機森林
0
A
回答
5
隨機森林不做特徵提取。他們使用給定的數據集中的特徵,在這個例子中,這些特徵只是來自Olivetti faces數據集的像素強度。
max_features
參數爲ExtraTreesRegressor
決定了「查找最佳拆分時要考慮的功能數量」(在森林使用的decision tree learning algorithm內)。
值32可能是憑經驗確定的。
5
這裏使用的特徵是原始像素值。由於數據集中的圖像是一致的,而且非常相似,這似乎足以完成任務。
2
正如其他人所說:在這個樸素的例子中沒有特徵提取:額外的樹只是使用原始像素作爲特徵。
在更真實的計算機視覺設置中,執行手動調整特徵提取很可能會導致更有趣的模型。要提取的功能類型取決於您要實現的計算機視覺任務。閱讀OpenCV庫中的文獻或示例以瞭解計算機視覺領域的最新技術(將神經網絡表示學習放在一邊,作爲現在的最新研究成果)。
該參數的32值可以隨機搜索。以主分支中的示例爲例:
http://scikit-learn.org/dev/auto_examples/randomized_search.html#example-randomized-search-py
相關問題
- 1. Python的 - 與scikit錯誤學習隨機森林約值格式
- 2. scikit學習隨機森林的概率分佈?
- 3. scikit隨機森林學習.9或更低
- 4. 隨機森林 - 概率估計(+ scikit學習具體)
- 5. Scikit學習 - 隨機森林:如何處理連續特徵?
- 6. 平行隨機森林scikit學習拋出一個異常
- 7. 監督學習隨機森林通過
- 8. scikit-learn中的隨機森林解釋
- 9. scikit-learn隨機森林的輸入
- 10. scikit隨機森林的使用sample_weights
- 11. Python Scikit隨機森林迴歸錯誤
- 12. 隨機森林:查找相關功能
- 13. LGPL機器學習與隨機森林 - C++
- 14. 隨機森林機器學習支持字符串字符嗎?
- 15. 如何解釋sci-kit隨機森林分類器的學習?
- 16. 如何SciKit學習隨機森林子樣本量可能等於原始訓練數據的大小?
- 17. ROC隨機森林
- 18. python中的隨機森林
- 19. 隨機森林中的R
- 20. SciKit-Learn:使用隨機森林時的JoblibException
- 21. 隨機森林(scikit-learn)中的bootstraps數量
- 22. 使用Scikit-Learn爲Python中的隨機森林繪圖樹
- 23. 在scikit-learn中使用隨機森林時的feature_importances_
- 24. Scikit學習中的隨機狀態(僞隨機數)
- 25. Scikit的學習隨機森林分類器中是否有內置方法來計算精度?
- 26. 具有自定義丟失功能的隨機森林
- 27. 具有比數據點更多功能的隨機森林
- 28. Spark隨機森林錯誤
- 29. 隨機森林,使用R
- 30. P值爲隨機森林