Haar級聯的圖像大小代價

OpenCV Haar級聯分類器似乎使用24x24的人臉圖像作爲其正面訓練數據。我有兩個關於這方面的問題：Haar級聯的圖像大小代價

老實說，我相信，有比圖像尺寸進行調整好得多參數。即便如此，這是一個精細到粗略的檢測問題 - 在更細的層次上，您獲得細節並在較粗糙的層次上獲得結構。此外，還有一個折衷：在24x24的檢測區域中，約有160,000個可能的矩形（haar-like）特徵，因此在訓練/測試中增加或減少也會影響這個數量（這就是爲什麼使用boosting來選擇區分特徵的小子集）。
正如你所說，這是因爲他的目標不同（即一支筆）。我認爲將先驗寬高比信息引入級聯訓練是明智的，否則，您將獲得具有筆檢測器的方形邊界框的檢測，並且可能因性能受到影響，因爲訓練階段正在拾取更大的背景區域鋼筆。
看到我的第一個答案。我認爲這主要是經驗性的。有一些用於特徵縮放或構建圖像金字塔的技術（例如參見this work），其也減輕了高度控制訓練目標圖像大小的選擇的有用性。

2013-05-30 21:11:23 bjou

回答