2016-03-30 77 views
5

我想使用tesseract創建新的列車數據。所以請按照下面提到的步驟進行操作。unicharset_extractor:找不到命令

https://blog.cedric.ws/how-to-train-tesseract-301

我得到以下錯誤而i的OS X終端執行Unicharset。

命令:

unicharset_extractor eng.micrtest.exp.box

錯誤: -bash:unicharset_extractor:找不到命令

我已經用下面的軟件版本

操作系統:OSX EI標題10.11.1

的tesseract 01年3月4日 leptonica-1.72 的libjpeg 8D:了libpng 21年1月6日:4.0.6的libtiff:LIB 1.2.5

是這可能在OSX執行unchaste_extractor命令?

在此先感謝。

+0

我知道這已經有一段時間了,但是你解決了你的問題嗎? – PhotometricStereo

回答

10

問題是 「Unicharset_extractor」 未在系統中安裝。所以,請安裝正方體培訓工具

INSTALL培訓工具

brew install --with-training-tools tesseract

請卸載正方體,如果你已經安裝了它。

UNINSTALL正方體

brew uninstall tesseract 

注:請閱讀日誌而安裝培訓工具,並按照其在日誌中提到的步驟。

安裝培訓工具需要一些時間,所以您絕對不會在終端上安靜。

請在安裝上述命令前安裝自制軟件。

+1

謝謝你張貼這個。我已經接近完成培訓了,但你的回答讓我走到了終點。對於Mac上的任何其他人,我使用http://vietocr.sourceforge.net/training.html和此答案來創建自定義'traineddata'文件。 – Adrian

+0

我試圖訓練多種格式的字體系列(粗體,斜體,窄體等)。到目前爲止,我只能弄清楚如何使用jTessBoxEditorFX來訓練一個。有什麼建議麼? – Adrian

1

您將需要構建Tesseract培訓可執行文件;它們與常規的Tesseract可執行文件是分開的。

https://github.com/tesseract-ocr/tesseract/wiki/Compiling

+0

嗨,這不是克隆我的系統tesseract。而且我還將tesseract安裝到我的系統並創建了盒子文件。我的要求是我需要執行unicharset在我的OS X EIcaptain 10.11.1 –