2009-12-15 111 views
7

我搜索了各地的開源OCR for Chinese。但沒有任何運氣,很少有可用的開源OCR(適用於中文)。開源OCR for Chinese

所以在這裏,我想知道:

  1. 是否有可用於生產環境,爲中國的任何開源OCR?

  2. 爲拉丁語和中文實施OCR時,主要區別是什麼?我知道一些很好的OCR如Tesseract或Ocropus,如果我想讓它支持中文,我該怎麼辦?

任何幫助表示讚賞和感謝提前〜

回答

4

您可以選擇:

  • 正方體3.0支持中國/日本
  • NHOCR支持日本
+0

現在可以下載Tesseract 3.0嗎?我在哪裏可以找到它的來源? –

+0

您可以查看http://code.google.com/p/tesseract-ocr/source/checkout。 –

0

中國具有比拉丁語更爲字符。有一些商業產品。其中一種方法是聯繫他們並獲得幫助。

我不認爲有中文或日文字符的開源。在OCR領域,除了模式識別算法之外,還有很多技術,公司擅長的不是開源社區。

+0

我也發現了一些開源的OCR日本。似乎中國人的選擇並不多。還是謝謝〜 –