3

我正在使用vl_phow函數(http://www.vlfeat.org/matlab/vl_phow.html)並想知道爲什麼在特徵提取之前應用平滑。特徵提取之前對圖像進行平滑

爲了是vl_phow中提到的文檔中更具體的:

的圖像通過標準偏差SIZE/MAGNIF的高斯核平滑。請注意,在標準SIFT描述符中,放大倍數值爲3;這裏默認的是6,因爲它在應用程序中似乎表現更好。

那麼爲什麼這個平滑操作完成了?

另外在同一個文檔中有WindowSize選項,其解釋如下:高斯窗口的大小以空間單元爲單位。 此窗口是否用於平滑圖像或其他內容?

您能否告訴我爲什麼這樣做以及在特徵提取之前對圖像進行平滑的優點。

回答

4

雖然這是一個比MATLAB問題更重要的數學問題,但無論如何我都會去做。

SIFT特徵應該是圖像中「突出」的點。它們是具有高信息內容的特徵,並且在不同的圖像中將是「不變的」。

但是,嘈雜的圖像可能有「噪音」,看起來像重要的東西。基本例如:

[0 0 0 0 0 
0 0 0 2 2 
0 1 0 2 2 
0 0 0 0 0] 

不平滑,可以認爲有2個區域有大量的信息那裏,2S面積與單1。但是該地區,同時用2秒的區域似乎像部分的信息,因爲它們中的很多一起存在,具有單個1的部分可能只是噪聲,由於成像技術中的噪聲而增加了一個小的隨機值。

如果順利的帶濾波器的圖像you'dd得到這樣的(由例如)

[0 0 0 0 0 
0 0 0 1.9 2 
0 0.01 0 1.9 2 
0 0 0 0 0] 

哪裏是方式更明顯,1只是噪音,但2S留下來。

這就是爲什麼特徵提取算法(如SIFT)在獲取關鍵點之前通常會平滑圖像的原因。

平滑窗口越大,關鍵點就越穩定,因爲更小的東西將被刪除。但是你也會找到更少的關鍵點。同樣使它太大,你可能會刪除真實的信息(例如2s)。

+0

我明白你的意思,但平滑中提取像密篩的特點vl_phow函數來完成。換句話說,它並不尋找關鍵點。它從圖像中的規則分佈點提取特徵。所以必須有另一個目的,而不是消除噪音。 –

+0

@burakakdemir它提取功能==尋找關鍵點 –

+0

@burakakdemir考慮接受答案,如果它幫助你 –

0

去除圖像中的噪點。特徵(傳統上強調角點)會受到噪音的很大影響。

0

沒有相機沒有噪音。除非你有一個人造的圖像,否則你的圖像總會有噪點。

這個噪音有很多來源,隨着時間的推移,溫度,甚至位置的變化。

您會發現,對輸入圖像應用像高斯模糊這樣的低通濾波器或對多個鏡頭進行平均是幾乎所有圖像處理操作中的第一步。

沒有這一點,幾乎不可能從同一個不變的場景獲得兩張圖像的相同結果。

對於噪聲源和去噪方法的簡要概述如下: http://www.ijaiem.org/volume2issue11/IJAIEM-2013-11-24-070.pdf