2013-07-19 61 views
2

像我之前的其他人HOG Trilinear Interpolation of Histogram Bins我想了解和實現HoG的三線插值。達拉爾的論文在這裏:HOG直方圖桶的三線插值澄清

http://lear.inrialpes.fr/people/dalal/NavneetDalalThesis.pdf

我努力理解的問題是,我的理解是,任務是值重新destribution成箱,而非已知的二進制數值的插值。 我很清楚方向維度中的一維情況;

,例如,如果我有75的已知像素梯度方向值和z1=60z2=80(倉步長b=20)的最近的塊,然後將像素值(在該情況下梯度幅值,說w=16)將在分發比例爲1:3進入相鄰的bin(4進入60 bin並且12進入80 bin)對吧?

當談到三維情況需要量值的空間插值,我很難過。我不明白這個數量級如何重新分配到適當的箱子。 任何明確的解釋,誰是引人矚目的緩慢,將不勝感激。

回答

0

直方圖由那伏乃爾達拉爾討論方向梯度,的討論了細胞的梯度幅值的內插成定向區間(爲0到180度,我們有9個箱與垃圾箱步長或20度帶寬)

一個簡單的方法就是對窗口/圖像中的每個單元格執行此操作,但這會導致混疊效果。爲了減少混疊,討論了應該將圖像分割成n×n個單元的塊(最好是重疊的)。
例如。爲64×128像素的圖像可以定義如下:
1.細胞大小= 8×8像素
2.塊大小= 2×2的細胞

這給出:
8×16的細胞,或
4×8 NON -overlapping塊的或具有8即7x15 50%的步幅
7x15塊重疊塊

因此,而不是執行每一個細胞的自身線性直方圖插值你將執行Ť在塊單元的rilinear interpoloation即trilinearly插值:
- 雙線性成
(塊的)空間細胞 - 線性成定向區間系首長三線性內插的

可視化: http://www.ultraimg.com/d7km