2012-05-27 62 views
1

我在Windows 7 64位上使用tesseract 3.0.1。培訓tesseract和多頁面tiff

培訓文檔說:

每個字體應該在一個單一的多頁TIFF放(只有當你使用 增加libtiff!)

我不是熟悉libtiff。我使用ImageMagick創建多頁TIFF。到目前爲止,這是行之有效的,或者至少似乎是。我是否預計稍後會獲得一些路障?如果是這樣,如何處理libtiff - 是否足以運行它的設置或我需要配置一些東西?

回答

1

Tesseract不關心你如何製作多頁TIFF,只要它可以用leptonica(內部依賴於libtiff)來閱讀它。如果tesseract現在可以處理您的tiff,它可以爲其餘的訓練過程以及OCR運行做同樣的事情,所以您很好。 我用.Net標準庫生成了我的多頁面tiff,而tesseract對它沒有任何問題。