在我們開始之前,我們先提出書面在他們的論文算法的僞代碼:
procedure AdaptiveThreshold(in,out,w,h)
1: for i = 0 to w do
2: sum ← 0
3: for j = 0 to h do
4: sum ← sum+in[i, j]
5: if i = 0 then
6: intImg[i, j] ← sum
7: else
8: intImg[i, j] ← intImg[i−1, j] +sum
9: end if
10: end for
11: end for
12: for i = 0 to w do
13: for j = 0 to h do
14: x1 ← i−s/2 {border checking is not shown}
15: x2 ← i+s/2
16: y1 ← j −s/2
17: y2 ← j +s/2
18: count ← (x2−x1)×(y2−y1)
19: sum ← intImg[x2,y2]−intImg[x2,y1−1]−intImg[x1−1,y2] +intImg[x1−1,y1−1]
20: if (in[i, j]×count) ≤ (sum×(100−t)/100) then
21: out[i, j] ← 0
22: else
23: out[i, j] ← 255
24: end if
25: end for
26: end for
intImg
是輸入圖像門檻integral image,假設灰度。
我已經成功實現了這個算法,所以讓我們來談談你的疑惑。
什麼是count
呢?如果它是窗口中的像素數,那麼根據算法,爲什麼它是2 * 2 = 4而不是3 * 3 = 9?
在論文中有一個他們不談論的基本假設。的s
需求值是奇數,而且窗口應該是:
x1 = i - floor(s/2)
x2 = i + floor(s/2)
y1 = j - floor(s/2)
y2 = j + floor(s/2)
count
肯定是在窗口的像素的總數,但你還需要確保你不出門的界限。在那裏你應該有一個3×3的窗口,所以s = 3
,而不是2.現在,如果s = 3
,但如果我們選擇i = 0, j = 0
,我們將有x
和y
值是負。我們不能有這個,因此在這個3×3窗口中的有效像素總數爲i = 0, j = 0
爲4,所以count = 4
。對於在圖像邊界內的窗口,則count
將是9。
此外,爲什麼像素的原始值乘以計數?該文件說,該值與周圍像素的平均值進行比較,爲什麼不是:
in[i,j] <= (sum/count) * ((100 - t)/100)
那麼呢?
你正在尋找的條件是在算法的第20行:
20: (in[i, j]×count) ≤ (sum×(100−t)/100)
爲什麼我們一起來看看in[i,j]*count
的原因是因爲我們假定in[i,j]
距離平均強度s x s
窗口。因此,如果我們檢查了s x s
窗口並將所有強度相加,則這等於in[i,j] x count
。該算法非常巧妙。基本上,我們比較s x s
窗口內的假定平均強度(in[i,j] x count
),並且如果這是小於t%
此s x s
窗口(sum x ((100-t)/100)
)內的實際平均的,則該輸出被設定爲黑色。如果它比較大,則輸出設置爲白色。但是,你已經雄辯地指出,它應該是這個:
in[i,j] <= (sum/count) * ((100 - t)/100)
這是基本相同線20條,但您可以通過count
除以等式的兩邊,所以它仍然是同樣的表情。我會說,這明確說明了我上面談到的內容。乘以count
當然令人困惑,所以你寫的更有意義。
因此,你只是看到了一種不同的方式,那很好!所以要回答你的問題,你所說的話肯定是正確的,並且等同於在實際算法中看到的表達式。
希望這有助於!
選取標籤時請多加註意。你選擇了「圖像」和「處理」而沒有打擾檢查他們的意思。第一個是關於圖像作爲文件,第二個是編程語言稱爲Processing。你應該改用「圖像處理」 –
爲什麼你說's = 2'?好像你想's = 3'和's/2 = 1.5'。一個非整數的s/2'大概是這類問題的一個問題 - 所以我看到你的關注。其實,也許算法只是假設's'總是偶數,而你的例子不是。在這種情況下,有界區域可能是'(x2,y2)'處像素的*獨佔*。 – nobar