2010-11-30 51 views
7

我正在尋找一個解釋/ API文檔/示例如何使用(和培訓?)Tesseract在C++中,在谷歌Tesseract頁面上沒有任何用處,但還沒有找到網絡上的東西。Tesseract或任何其他OCR lib

任何有用的來源,經驗都會比歡迎,因爲我不知道如何開始。

P.S:

  1. 我打開其他 庫的建議。
  2. 只有免費

回答

4

我有一個正方體... 培訓正方體「的一個簡單的谷歌的一些經驗顯示此頁: http://code.google.com/p/tesseract-ocr/wiki/TrainingTesseract ,你必須選擇你想要哪個正方體的版本火車.. 儘管3是最新版本,但它是全新的,因此人們仍然在解決任何問題 - 即時通訊仍然使用2.4版本。無論如何,你會發現爲特定的「語言」(或者應該被稱爲'字體'或'字符集')訓練tesseract大約有9個步驟。您也可以使用現有的'eng'語言 - 但這取決於您的應用程序。例如,在我的應用程序中,我將不得不進行文檔分析並採取特定區域,並希望OCR輸入一串13個字符的數字 - 我需要很高的準確性 - 而且我不希望它將'5'讀作' S'和'0'爲'O'等,所以根據我的特定字體創建一個特定的「語言」是唯一的,它只包含字符0..9,而你可能並不在乎是否有額外的噪音

+0

謝謝,任何想法,我找到一個教程/ API文檔的C + +? – snoofkin 2010-11-30 18:34:33

0

Tesseract Ocr是一個用於檢測光學字符的開源庫。如果您使用的是Visual Studio,則只需包含庫文件即可。如果您正在使用qt創建器,那麼您必須構建庫以在QT上工作。您需要使用CMakelist或Cmake Gui構建庫。 您可以訪問的鏈接 Opencv Ocr build for Qt 5.4 mingw