我需要一些將執行西裏爾字母識別字符的函數庫。 我只有一個想法,即將信件從西里爾文映射到拉丁文,但質量很差。 有人可以告訴我是否有任何lib。或者以其他方式解決這個問題?java西里爾文字符識別API
在此先感謝。
我需要一些將執行西裏爾字母識別字符的函數庫。 我只有一個想法,即將信件從西里爾文映射到拉丁文,但質量很差。 有人可以告訴我是否有任何lib。或者以其他方式解決這個問題?java西里爾文字符識別API
在此先感謝。
據我所知,沒有本地開源Java OCR SDKs。有一些Java API封裝了本地接口的調用,例如,對於最流行的開源OCR引擎之一 - Tesseract(http://groups.google.com/group/tesseract-ocr/) - 有一些Java包裝器tesjeract(http://code.google.com/p/tesjeract/)或Tess4J(http://tess4j.sf.net/)。這可以爲你工作,但它很難設置,並需要開發圖像預處理和字體訓練在你身邊。
另一個解決方案可能是雲服務。它要求最終用戶應用程序具有互聯網連接,但它獨立於編程語言選擇和資源限制。看看ABBYY Cloud OCR SDK,它是ABBYY最近推出的基於雲的OCR SDK。它處於測試階段,所以現在它完全免費使用,它有一個隨時可用的Java code samples。
爲了使圖片完整我還會提及Asprise,它只是本地Java OCR,但它不是開源的,不支持西里爾。事實上,我從來沒有聽說過其質量的任何好處(只有這個:http://stackoverflow.com/a/3731291/137353),並沒有看到它在任何OCR準確性比較中被調過。 – Tomato 2012-01-10 16:17:23
雖然不是在Java中,當涉及到OCR我建議開放源碼Ocropus系統http://code.google.com/p/ocropus/
而且,這個線程討論Java的OCR解決方案Java OCR implementation
此外,如果你只是想要一些特別的解決方案,你可以嘗試谷歌文件OCR http://googlesystem.blogspot.com/2009/09/google-docs-ocr.html
從符號語音識別?你的意思是光學字符識別是光學字符識別? – bpgergo 2012-01-09 10:06:22
哦,對不起,可能是我錯誤地定義了問題。我的意思是像一封信的符號。 – Oleksandr 2012-01-09 10:12:11