2015-07-19 31 views
0

我基本上遵循一篇論文「使用統計語言模型來改進基於HMM的草書手寫體識別系統的性能」。提取圖像的輪廓位置和方向

這裏作者已經從每個滑動窗口中提取了9個特徵的矢量。引用紙張:

前三個特徵是窗口的重量,它的中心重力和窗口的二階矩。

特點四個和五個限定在窗口的上部和下部 輪廓的位置,設有六,七通過在 窗口位置的輪廓的梯度得到的 取向的上和下輪廓,設有8在垂直方向上給出從黑色到白色的 轉換的數量,而功能9給出在上部和下部輪廓之間的黑色像素的數量 。

我設法計算出論文的前三個特徵,但我似乎無法理解特徵4,5,6,7,8。

我可以計算圖像的輪廓。假設,這是文本行中的一個(窗口是長度爲14個像素的,由紙所建議的)的窗口:

enter image description here

而這是圖像的所提取的輪廓:

enter image description here

那麼這裏的上下輪廓究竟是什麼?從哪裏可以考慮極限,如果它涉及頂部和底部像素,那麼我可以提取那些沒有輪廓提取?同樣,這些輪廓的方向也同樣令人困惑。

我真的很感謝這裏的一些指導。

+0

圖像不可見。請修改它們。 – NKN

+0

@NKN我在不同的瀏覽器上試過它,圖像正在爲我工​​作。你可以請再試一次 – ipunished

+0

這是我看到的圖像,也許整個圖像應該是這樣的,我沒有任何想法。 http://pasteboard.co/26C6SF7U.png – NKN

回答

1

我看了一篇文章,並且非常肯定「上」和「下」應該被讀作「最高」和「最低」。這尤其有意義,因爲作者特別關注對數據進行預處理,以便在水平和垂直兩個方向進行歸一化處理。他們注意有一種健壯的規模,書寫角度,...

我想功能4和5可以是等高線的極值座標,它結合梯度的功能6 & 7 =方位,可以很好地瞭解輪廓的這些部分的形狀。

特徵9將主要用於區分可能具有類似垂直形狀的字母,例如「i」,「l」,「j」。

這是我的理解。希望這可以幫助!

+0

感謝您的回答,是的,我已經完成了論文中提到的預處理。所以最低值和最低值是最高像素和最低像素?如果是這樣的話,我不能從原始的黑白圖像中獲取那些圖像嗎?爲什麼我必須得到圖像的輪廓? – ipunished

+1

我認爲輪廓是有用的,原因有兩個: - 它們確保圖像中沒有可能引起錯誤特徵值的僞影(=孤立噪點像素) - 它們規範了特徵9,上下輪廓「。使用輪廓可以實際檢測黑白轉場的數量。所以「l」不會有過渡,但是「i」會因點而有2。 「s」將會有4.這是字母之間的另一個區別。 如果您在白色背景上使用黑色輪廓,第9個功能纔有意義。 (與第一篇文章中的圖片相反) – Eskapp