2010-08-19 228 views
7

我在第二步中遇到了一個問題,即在空間單元格上爲梯度方向累加加權投票。計算HOG特徵

假設單元格爲8*8。讓我使用兩個矩陣GO[8][8]([1 9]),GM[8][8]分別表示梯度方向和梯度幅度。 梯度方向範圍從0 - 180,並有9定向箱。

根據我對HOG的理解,對於單元格中的每個像素,將其梯度大小添加到其相應的方向bin。這樣,我們就可以得到每個單元格的直方圖。

但有一句話令我困惑。

爲了減少混淆,票(梯度幅度)在兩個方向 和位置相鄰分級中心之間的插值 trilinearly。

爲什麼插值?如何內插?有人可以解釋更詳細的?沒有減少鋸齒。

在此先感謝。


這句話是在那伏乃爾達拉爾的博士論文,P38,線4

+0

檢查答案在這裏:http://stackoverflow.com/questions/32417531/hog-what-is-done-in-the-contrast-normalization-step/32465249#32465249 – SomethingSomething 2015-09-16 23:00:21

回答

8

插補是用於計算直方圖的標準技術。這裏的想法是,每個值不是簡單地放入一個bin中,而是根據離原始bin中心有多遠來分佈在兩個相鄰bin(假設爲1d直方圖)之間。

這樣做的目的是處理測量中的小錯誤可能導致將值放入不同倉的情況。對於任何類型的直方圖來說,這是一件非常好的事情,而不僅僅是HOG,假設你有CPU週期。

對於2d和3d直方圖,還有雙線性和三線性插值,其中每個值分別分佈在4和8個相鄰倉之間。

+1

非常感謝。我知道了。 – Fihop 2010-08-19 21:12:16