2013-02-12 376 views
11

我正在嘗試訓練Tesseract,以獲取可用於我的Android應用程序的新字體。我只需要訓練數字,所以我創建了一個訓練圖像,box文件和unicharset文件。獲取錯誤:「inttemp讀取錯誤!」當在Tesseract 2中訓練一種新字體時

我按照the training instructions,但是當我試圖運行tesseract它說,bad read of inttemp!

我在做什麼錯?我如何診斷這個錯誤?

+1

培訓是相當痛苦的。仔細檢查培訓工作流程的日誌以獲取警告和錯誤。如果出現問題,你的訓練數據是無用的。 – n3utrino 2013-02-13 14:20:21

+0

@gabe,你能建議任何有用的鏈接嗎? – Dipin 2013-02-14 04:12:25

+0

我花了很多時間在https://groups.google.com/forum/?fromgroups=#!forum/tesseract-ocr也許這是你的東西https://gitorious.org/ancient-greek-training-for -tesseract/tesstrainingtools – n3utrino 2013-02-14 10:57:12

回答

0

http://code.google.com/p/tesseract-ocr/issues/detail?id=155

原來,正方體仍在繼續回到 「C:\ Program Files文件\的Tesseract-OCR」 文件夾 - 包括使用培訓文件夾內有3.0訓練前男友。在我運行命令的地方沒有什麼區別 - 猜測當它有一個路徑變量時,tesseract忽略它。

替換該文件夾中的所有3.0 exe文件和培訓文件。丟棄在2.0.4文件和提取命令工作!我應該已經解決了這個問題的種種原因較快,但..

試試這個

http://www.win.tue.nl/~aeb/linux/ocr/tesseract.html