2013-11-21 40 views
1

我在Java項目中使用Tesseract的Java包裝器Tess4J以獲取土耳其語中的圖像的OCR。該項目具有從客戶端調用的Web方法。我的問題是:我應該在哪裏放置土耳其語數據文件?如果我把tur.traineddata文件放在我的項目文件夾的某個地方,Tesseract是否工作?或者,我必須將tesseract安裝到服務器機器上,並將tur.traineddata放在tessdata文件夾下?Java項目中的Tesseract中的語言文件的位置

回答

1

您可以將語言數據文件放在任何地方。請務必在Init方法中指定其位置,或爲其設置TESSDATA_PREFIX環境變量。

+0

謝謝。我會試試這個。 – lamostreta

2

在Tesseract類中有一個方法setDatapath(字符串路徑),你可以調用這個方法來告訴Tesseract在哪裏尋找語言文件來執行ocr例如假設你的tessdata文件夾在D:\ My_Language_Files文件夾中,那麼你有通過 「d:\ My_Language_Files」 字符串setDatapath()方法,例如

Tesseract instance = Tesseract.getInstance(); instance.setDatapath("D:\My_Language_Files"); instance.setLanguage("eng");

相關問題