我是新的Tesseract用培訓的圖像和文字教學Tessearact
我正在使用Windows操作系統。 我想教tesseract使用我自己的80字體的字體。沒有其他的。我讀了這樣的解釋:
https://code.google.com/p/tesseract-ocr/wiki/TrainingTesseract3
但我不能找到一個名爲「培訓」一個可執行文件。也沒有文件稱爲「text2image」,因爲它是在其他論壇寫的。
如果我在Windows上的字體是本地安裝的,我可以解釋如何獲得所需的tesseract庫,我準備好了tiff文件並準備好了培訓文本。
培訓/ text2image --text = 「C:\項目\掃描儀\ training_text.txt」 --outputbase = ocr.ocrb.exp0 --font = '宋體' --fonts_dir =「C:\的Windows \字體」
text2image是tesseract-ocr 3.04版本的工具。 – user898678
謝謝。如何訓練當前版本的tesseract? – Nasenbaer
當前版本是3.04版本。有什麼不明確的說明https://github.com/tesseract-ocr/tesseract/wiki/TrainingTesseract? – user898678