2013-08-19 70 views
0

我目前在Matlab中實現HOG,但是我不瞭解binning,尤其是三線插值部分。HOG中的三線插值

我的理解是,一個單元格中的每個像素都被放入一個bin中以形成該單元格的直方圖。但這就是我所瞭解的全部。

  1. 如何計算大小?
  2. 立方體的邊緣是什麼,一個像素的3D座標是多少?
+0

你檢查他的[鏈接](https://www.youtube.com/watch?v=0Zib1YEE4LU)爲清晰的想法 –

回答

1

Wikipedia描述了梯度(在圖像的情況下),並顯示如何獲得其xy座標。

如何計算大小?

r = sqrt(x*x+y*y) 

什麼是三維座標的一個像素?

當計算梯度時,圖像被視爲高度圖。對於位於(x,y)且灰度值爲z的像素,它表示高度圖3D位置(x,y,z)

(x,y,z)的梯度具有方向和大小。直方圖是將所有可能的方向離散化爲分箱。例如,如果有8個垃圾箱,從0到45度的所有方向都將與同一垃圾箱相關聯。

箱的選擇基於梯度方向,並根據幅值將重量添加到箱中。

Wikipedia描述了HOG的步驟,並給出了原始論文中的細節指針。