提取圖像的輪廓位置和方向

我基本上遵循一篇論文「使用統計語言模型來改進基於HMM的草書手寫體識別系統的性能」。提取圖像的輪廓位置和方向

這裏作者已經從每個滑動窗口中提取了9個特徵的矢量。引用紙張：

前三個特徵是窗口的重量，它的中心重力和窗口的二階矩。

特點四個和五個限定在窗口的上部和下部輪廓的位置，設有六，七通過在窗口位置的輪廓的梯度得到的取向的上和下輪廓，設有8在垂直方向上給出從黑色到白色的轉換的數量，而功能9給出在上部和下部輪廓之間的黑色像素的數量。

我設法計算出論文的前三個特徵，但我似乎無法理解特徵4,5,6,7,8。

我可以計算圖像的輪廓。假設，這是文本行中的一個（窗口是長度爲14個像素的，由紙所建議的）的窗口：

enter image description here

而這是圖像的所提取的輪廓：

enter image description here

那麼這裏的上下輪廓究竟是什麼？從哪裏可以考慮極限，如果它涉及頂部和底部像素，那麼我可以提取那些沒有輪廓提取？同樣，這些輪廓的方向也同樣令人困惑。

我真的很感謝這裏的一些指導。

來源

2015-07-19 ipunished

圖像不可見。請修改它們。 – NKN

@NKN我在不同的瀏覽器上試過它，圖像正在爲我工作。你可以請再試一次 – ipunished

這是我看到的圖像，也許整個圖像應該是這樣的，我沒有任何想法。 http://pasteboard.co/26C6SF7U.png – NKN

我看了一篇文章，並且非常肯定「上」和「下」應該被讀作「最高」和「最低」。這尤其有意義，因爲作者特別關注對數據進行預處理，以便在水平和垂直兩個方向進行歸一化處理。他們注意有一種健壯的規模，書寫角度，...

我想功能4和5可以是等高線的極值座標，它結合梯度的功能6 & 7 =方位，可以很好地瞭解輪廓的這些部分的形狀。

特徵9將主要用於區分可能具有類似垂直形狀的字母，例如「i」，「l」，「j」。

這是我的理解。希望這可以幫助！

來源

2015-07-19 19:29:49 Eskapp

感謝您的回答，是的，我已經完成了論文中提到的預處理。所以最低值和最低值是最高像素和最低像素？如果是這樣的話，我不能從原始的黑白圖像中獲取那些圖像嗎？爲什麼我必須得到圖像的輪廓？ – ipunished

我認爲輪廓是有用的，原因有兩個： - 它們確保圖像中沒有可能引起錯誤特徵值的僞影（=孤立噪點像素） - 它們規範了特徵9，上下輪廓「。使用輪廓可以實際檢測黑白轉場的數量。所以「l」不會有過渡，但是「i」會因點而有2。「s」將會有4.這是字母之間的另一個區別。如果您在白色背景上使用黑色輪廓，第9個功能纔有意義。（與第一篇文章中的圖片相反） – Eskapp

提取圖像的輪廓位置和方向

回答

相關問題