我使用隨機森林算法作爲我的論文項目的分類器。 訓練集由數千個圖像組成,每個圖像大約有2000個像素被採樣。對於每個像素,我擁有數十萬個功能。由於我目前的硬件限制(RAM的8G,可能可擴展到16G),我可以用 來將樣本(即每個像素的特徵)僅存儲在一個圖像中。我的 的問題是:是否有可能多次調用列車方法,每次用不同圖片的樣本 ,並獲得統計模型自動 在每次調用時更新?我對變量的重要性特別感興趣,因爲在對整個訓練集進行了整個訓練集的訓練之後,我的想法是將特徵的數量從數十萬減少到約2000,並且只保留最重要的特徵的數量爲 。OpenCV迭代隨機森林培訓
謝謝你的任何建議, 丹尼爾
不幸的是,我讀了你的答案爲時已晚。我最終以自定義實現方式與您的方式類似(樹木以呼吸優先的方式增長)。此外,增長按每個節點完成並使用OpenCL進行並行化。所有的代碼都在http://code.google.com/p/parloma/source/browse/#svn%2Ftrunk%2Frandom_forest_gpu。該代碼現在特定於我的問題(手姿態識別),希望找到時間來重寫庫來處理通用問題。 – mUogoro
更通用的實現可以在這裏找到https://github.com/mUogoro/padenti – mUogoro