2013-05-30 27 views
4

OpenCV Haar級聯分類器似乎使用24x24的人臉圖像作爲其正面訓練數據。我有兩個關於這方面的問題:Haar級聯的圖像大小代價

  • 除了更大的訓練圖像需要更多的處理這一事實之外,選擇訓練圖像大小的考慮因素是什麼?
  • 對於非正方形圖像,some people已選擇保持一個維度爲24px,並根據需要展開另一個維度(比如說100-200px)。這是正確的策略嗎?
  • 一個人如何去決定訓練圖像的大小(這是問題1的變體)

回答

7
  • 老實說,我相信,有比圖像尺寸進行調整好得多參數。即便如此,這是一個精細到粗略的檢測問題 - 在更細的層次上,您獲得細節並在較粗糙的層次上獲得結構。此外,還有一個折衷:在24x24的檢測區域中,約有160,000個可能的矩形(haar-like)特徵,因此在訓練/測試中增加或減少也會影響這個數量(這就是爲什麼使用boosting來選擇區分特徵的小子集)。

  • 正如你所說,這是因爲他的目標不同(即一支筆)。我認爲將先驗寬高比信息引入級聯訓練是明智的,否則,您將獲得具有筆檢測器的方形邊界框的檢測,並且可能因性能受到影響,因爲訓練階段正在拾取更大的背景區域鋼筆。

  • 看到我的第一個答案。我認爲這主要是經驗性的。有一些用於特徵縮放或構建圖像金字塔的技術(例如參見this work),其也減輕了高度控制訓練目標圖像大小的選擇的有用性。