2012-01-09 240 views
1

我需要一些將執行西裏爾字母識別字符的函數庫。 我只有一個想法,即將信件從西里爾文映射到拉丁文,但質量很差。 有人可以告訴我是否有任何lib。或者以其他方式解決這個問題?java西里爾文字符識別API

在此先感謝。

+1

從符號語音識別?你的意思是光學字符識別是光學字符識別? – bpgergo 2012-01-09 10:06:22

+0

哦,對不起,可能是我錯誤地定義了問題。我的意思是像一封信的符號。 – Oleksandr 2012-01-09 10:12:11

回答

4

據我所知,沒有本地開源Java OCR SDKs。有一些Java API封裝了本地接口的調用,例如,對於最流行的開源OCR引擎之一 - Tesseract(http://groups.google.com/group/tesseract-ocr/) - 有一些Java包裝器tesjeract(http://code.google.com/p/tesjeract/)或Tess4J(http://tess4j.sf.net/)。這可以爲你工作,但它很難設置,並需要開發圖像預處理和字體訓練在你身邊。

另一個解決方案可能是雲服務。它要求最終用戶應用程序具有互聯網連接,但它獨立於編程語言選擇和資源限制。看看ABBYY Cloud OCR SDK,它是ABBYY最近推出的基於雲的OCR SDK。它處於測試階段,所以現在它完全免費使用,它有一個隨時可用的Java code samples

+1

爲了使圖片完整我還會提及Asprise,它只是本地Java OCR,但它不是開源的,不支持西里爾。事實上,我從來沒有聽說過其質量的任何好處(只有這個:http://stackoverflow.com/a/3731291/137353),並沒有看到它在任何OCR準確性比較中被調過。 – Tomato 2012-01-10 16:17:23