2017-10-12 56 views
0

我知道我們在關鍵點周圍放置了一個16x16的「中間」像素窗口。我們將該窗口分成16個4x4窗口。從每個4x4窗口,我們生成一個8個bin的直方圖。每個箱對應0-44度,45-89度等。將來自4x4的梯度方向放入這些箱中。這是爲所有4x4塊完成的。最後,我們對你得到的128個值進行歸一化。 當他們得到他們的價值128篩選描述符的值?

但我誤解了其中128號從得到他們的價值?它是指相應的方向值大小還是什麼?

如果有人描述的任何數值例子問候我將不勝感激!

+0

你可以更清楚一下你在問什麼? –

回答

0

在SIFT(尺度不變特徵轉換)和128維特徵向量是由每個窗口的4x4樣本中8個方向,每個樣品 - 4x4x8 = 128

對於所示導向看到A Short introduction to descriptors ,特別是該圖像中,示出了嵌入在每個4×4網格正方形(中央圖像)的8個方向的測量(Cardinal和-基數間),然後方向的直方圖(右圖片):

enter image description here

從y我們的問題,我相信你也不清楚描述符內的信息是 - 它被稱爲定向梯度直方圖(Histogram of Oriented Gradients,HOG)。進一步閱讀,維基百科有HOG gradient computation的概述:

在小區內的每個像素爲投射基於在梯度計算中的值的基於方向的直方圖信道的加權表決。

一切是建立在那些每個像素的「選票」。