在圖像中查找文本

我目前正在進行一個項目，我的目標是在圖像中查找文本。 OCR的文本是不是我的意圖到目前爲止。我想基本上獲得圖像內文本的邊界。我正在使用AForge.Net成像組件進行操作。在某種意義上或其他方面的協助？在圖像中查找文本

更新09年2月5日：我已經沿着我的項目中的另一條路線。不過，我嘗試使用MODI（Microsoft Office Document Imaging）獲取文本。它使您可以輕鬆地OCR圖像並從中拉出文本。

2008-08-05 Pat

這是一個活躍的研究領域。關於這個問題，學術論文的字面上有很多。特別是沒有更多的資格，給你提供幫助將會很困難。你在尋找特定類型的文字嗎？字體？僅限英語？你熟悉學術文獻嗎？

「文本檢測」是任何OCR（光學字符識別）系統中的標準問題，因此在處理它的網頁上存在大量代碼。

我可以開始列出從谷歌鏈接堆，但我建議你只是做一個「文本檢測」的搜索，並開始閱讀:)。還有充足的示例代碼可用。

2008-08-05 03:24:27

識別圖像中的文字確實是該領域研究人員的熱門話題，但是隻有當captcha's成爲防範垃圾郵件機器人的「標準」時纔開始失控。爲什麼使用captcha作爲保護？因爲它很難在圖像中查找（並閱讀）文本！

我之所以提到captcha的原因是因爲最大的進步*是在這個微小的區域內完成的，我認爲你的解決方案可以在那裏找到最好的。特別是因爲captcha的確是關於在混亂的圖像中查找文本（或類似文本的東西），然後嘗試正確地讀取這些字母。

所以，如果你可以找到自己a good open source captcha breaking tool你可能有所有你需要繼續你的追求...
你也許甚至扔掉，處理字符識別本身是最難治的代碼，因爲那些OCR的用於讀取扭曲的文字，你不需要做的事情。

*：在進步可見，易用，實用信息條款「非研究人員」

2008-08-05 06:00:46 sven

提到驗證碼的另一個原因是這可能是他的「項目」。 :-) – 2009-02-05 17:37:16

如果你確定使用這個網上API，在http://www.wisetrend.com/wisetrend_ocr_cloud.shtml的API可以做文字除了OCR之外的檢測。

2010-06-23 05:49:10

Stroke width transform可以爲您做到這一點。這至少是MS爲他們的手機操作系統開發的。關於實現的討論是here at https://stackoverflow.com/

2013-04-19 14:54:49 Mathias

回答