2013-09-26 72 views
-1

我對如何在互聯網上挖掘信息以及如何從圖像中提取文本感興趣。關於如何在互聯網上挖掘信息並從圖像中提取文本的建議

所以我正在尋找如何做到這一點的信息,我想自己編程。是否有任何文件能夠提供關於採礦和開採的良好解釋?

有人可以幫助我的方式嗎?

親切的問候,

+0

你能提供一些你想要的OCR想象嗎? –

+0

要求推薦的問題,特別是涉及到庫時,在Stack Overflow中是無關緊要的。但是,如果你確實嘗試編寫代碼並有更具體的問題,人們會很樂意提供幫助。 – Renan

+0

各種圖像,它可以是一個帶有文字的照片。 – user1007522

回答

-1

你可以看看Tess4J這是Tesseract Java包裝。也就是說,圖像處理(文本提取)通常需要先進行一些預處理,刪除顏色和部分,這些顏色和部分不包含最常見的文本。