2012-02-28 55 views
7

我不明白任何OCR的東西。我只需要(如果甚至可能的話)得到一個.jar導入到Eclipse,我可以給一個圖像(.bmp,.tiff,.jpeg)輸入,它會輸出一個字符串與圖像的文本內容。這不是驗證碼或手寫,只是一些字母的簡單「照片」。在eclipse上的JAVA OCR API開源

讚賞開源解決方案。我見過這樣Tess4j或JavaOCR項目,但他們有點複雜,處理:(

任何人有一個建議

更新:?我發現AspriseOCR是非常容易使用,只需導入到的.jar構建路徑並調用一個方法很好!但是......我不能在自己的項目中使用它!你知道任何一個庫像Asprise一樣簡單(我不需要編譯任何東西,或者有任何類型的培訓:只是導入,這就是它!)

+0

檢查此:http://stackoverflow.com/questions/1813881/java-ocr-implementation和此http://asprise.com/product/ocr/index.php?lang=java – Favonius 2012-02-28 11:22:54

+0

1)爲什麼'打開-資源?你是否暗示某個不知道OCR內容的人*可能會對代碼進行更改或擴展?或者你的意思是「免費」? 2)'Java'只有一個大寫字母,它是一個專有名稱,而不是拼寫'JAVA'的首字母縮略詞。3)請忽略「Greetings N」之類的噪音。 – 2012-02-28 11:28:57

+2

感謝您的回答。 1)開源僅僅是因爲我沒有錢購買圖書館!我不想對代碼進行任何擴展,但我可以在我的一個移動應用程序中使用它。 2)我沒有英語作爲我的「母語」,所以我可以犯一些錯誤,對不起。 3)我總是試圖禮貌:) – nunoaac 2012-02-28 11:37:16

回答

9

至於我知道沒有本地開源Java OCR SDK。有一些Java API封裝了本地接口的調用,例如,對於最流行的開源OCR引擎之一 - Tesseract(http://groups.google.com/group/tesseract-ocr/) - 有一些Java封裝器,如tesjeract(http://code.google.com/p/tesjeract/)或Tess4J(http://tess4j.sf.net/)。這可以爲你工作,但它很難設置,並需要開發圖像預處理和字體訓練在你身邊。

另一個解決方案可能是雲服務。它要求最終用戶應用程序具有互聯網連接,但它獨立於編程語言選擇和資源限制。看看http://ocrsdk.com,這是一款基於雲的OCR SDK,可讓您通過Web API上傳圖片並返回OCR數據。這個基於Web API的OCR SDK並不是免費的,可能並不適合你,但我仍然建議你嘗試一下(它有免費的試用版),因爲它的定價與企業解決方案相比是非常實惠的,而它提供了企業級OCR的準確性比開源更好。你也可以在github上找到有用的Java codesample。 Disclamer:我在@ ABBYY工作。

+0

ABBYY是否也允許我們上傳PDF文件(可能是掃描文檔)以獲取OCR數據? – Dax 2016-04-21 16:16:38