2008-08-05 33 views
25

我目前正在進行一個項目,我的目標是在圖像中查找文本。 OCR的文本是不是我的意圖到目前爲止。我想基本上獲得圖像內文本的邊界。我正在使用AForge.Net成像組件進行操作。在某種意義上或其他方面的協助?在圖像中查找文本

更新09年2月5日: 我已經沿着我的項目中的另一條路線。不過,我嘗試使用MODI(Microsoft Office Document Imaging)獲取文本。它使您可以輕鬆地OCR圖像並從中拉出文本。

回答

12

這是一個活躍的研究領域。關於這個問題,學術論文的字面上有很多。特別是沒有更多的資格,給你提供幫助將會很困難。你在尋找特定類型的文字嗎?字體?僅限英語?你熟悉學術文獻嗎?

「文本檢測」是任何OCR(光學字符識別)系統中的標準問題,因此在處理它的網頁上存在大量代碼。

我可以開始列出從谷歌鏈接堆,但我建議你只是做一個「文本檢測」的搜索,並開始閱讀:)。還有充足的示例代碼可用。

3

識別圖像中的文字確實是該領域研究人員的熱門話題,但是隻有當captcha's成爲防範垃圾郵件機器人的「標準」時纔開始失控。爲什麼使用captcha作爲保護?因爲它很難在圖像中查找(並閱讀)文本!

我之所以提到captcha的原因是因爲最大的進步*是在這個微小的區域內完成的,我認爲你的解決方案可以在那裏找到最好的。 特別是因爲captcha的確是關於在混亂的圖像中查找文本(或類似文本的東西),然後嘗試正確地讀取這些字母。

所以,如果你可以找到自己a good open source captcha breaking tool你可能有所有你需要繼續你的追求...
你也許甚至扔掉,處理字符識別本身是最難治的代碼,因爲那些OCR的用於讀取扭曲的文字,你不需要做的事情。

*:在進步可見,易用,實用信息條款「非研究人員」

+0

提到驗證碼的另一個原因是這可能是他的「項目」。 :-) – 2009-02-05 17:37:16