2013-03-28 57 views
0

我正在關注these instructions,用於爲新字體培訓Tesseract OCR引擎。無法在Tesseract中創建boxfile(或打開tiff)

但是,當試圖製作box文件時,出現錯誤。這是我使用的命令:

H:\Documents\TesseractTraining>tesseract eng.helvetica.exp0.tif eng.helvetica.exp0 batch.nochop makebox 

這裏是錯誤消息:

Tesseract Open Source OCR Engine v3.02 with Leptonica 
TIFFstream: Sorry, can not handle image. 
Unsupported image type. 

一些谷歌上搜索顯示,有可能是與Leptonica安裝錯誤。我甚至不知道Leptonica是否安裝在我的電腦上,並且網頁上有幾個自述文件(一個名爲「README」,另一個名爲「Documentation」),令人感到困惑,但他們中沒有一個足以讓我理解我將如何製作它在Windows上工作。我有Visual Studio 2008的Express Edition,所以我不能使用建議的命令提示符。

所以,我的問題是:有人知道什麼可能是錯的,我如何解決它?

回答

3

看起來你有一個不好的形象。您可以使用jTessBoxEditor工具創建適合訓練目的的TIFF圖像。

+0

無恥的插件,但...我也創建了一個程序,這樣做(生成盒文件+ TIFF)寫在Qt - https://code.google.com/p/tesseract-trainer/ – sashoalm

+0

jTessBoxEditor做不給一個好tiff ..這個解決方案是否適合你?添加任何選項以獲得正確的tiff文件?當我運行batch.nochop的makebox我得到錯誤tessdata_manager.SeekToStart(TESSDATA_INTTEMP):錯誤:斷言失敗:在文件.. \ .. \分類\ adaptmatch.cpp,行555 – blganesh101

相關問題