2011-09-25 45 views
0

我試圖回憶一些關於字母的信息以啓動某種帶有神經網絡的OCR。我還沒有真正將所有的東西結合在一起,但是,我現在面臨的問題是如何區分字符並將它們分開。喜歡的東西http://pp19dd.com/tesseract-ocr-chopper/?i=ocrFTYzRJ (沒有什麼特別的,只是普通字體)識別圖像上字符的開始和結束XY向量

我認爲更好的辦法是使for循環得到頂,最低x和y考慮每個字符和數字有加入的各個黑像素數量較大其他(雖然我是個例外)。

有沒有什麼樣的庫或算法可以幫助我呢?我使用Cimg進行圖像處理。

難道這是真的硬?

回答

1

這聽起來像你正在尋找一個連接組件標籤。我們的想法是掃描圖像以獲得彼此連接的像素組,並返回一組對象(通常稱爲「斑點」),其中每個對象都包含該對象中的像素列表。

我不建議您自己寫。 OpenCV有一個很好的工作,它基於

F.Chang,C.-J.Chen和C.-J.Lu,「線性時間分量標記算法使用輪廓跟蹤技術」,計算機視覺和圖像理解,第一卷。 93,沒有。 2,pp。206-220,2004.

這裏有一個更好的解決方案,專門用於查找字母。

+0

感謝您的回答。我會研究OpenCV,我同意如果已經有一些我可以使用的算法,我應該儘量避免自己做。是http://opencv.willowgarage.com/wiki/cvBlobsLib#Features你在說什麼,對吧? – Filgera

+0

是的,就是這樣。 OpenCV非常好。 – dantswain

0

你檢查了OpenCV項目嗎? Here是一個使用它編號OCR的教程。