爲什麼返回此錯誤？tesseract（v3.03）輸出爲PDF

[email protected] ~/ocr_test # tesseract -l dan pdf.png out pdf 
Tesseract Open Source OCR Engine v3.03 with Leptonica 
Error opening data file /usr/local/share/tessdata/osd.traineddata 
Please make sure the TESSDATA_PREFIX environment variable is set to the parent directory of your "tessdata" directory. 
Failed loading language 'osd' 
Tesseract couldn't load any languages! 
Warning: Auto orientation and script detection requested, but osd language failed to load

語言列表

[email protected] ~/ocr_test # tesseract --list-langs 
List of available languages (3): 
eng 
dan 
dan-frak

輸出爲txt

這工作得很好，並輸出文本out.txt

tesseract -l dan pdf.png out

輸出PDF

這將創建out.pdf也retuns提到的錯誤，並在PDF中搜索文本沒有意義

tesseract -l dan pdf.png out pdf

來源

2014-03-02 clarkk

該錯誤信息是明確的：它需要osd.traineddata文件。您可以從https://github.com/tesseract-ocr/tessdata安裝或下載方向& Tesseract腳本檢測數據。

來源

2014-03-02 22:20:57 nguyenq

存儲庫已移至https://github.com/tesseract-ocr/tessdata – Joe

如何安裝？ – happybuddha

tesseract（v3.03）輸出爲PDF

語言列表

輸出爲txt

輸出PDF

回答

相關問題