2013-04-09 81 views
3

即時通訊編寫一個簡單的OCR在C#和IM使用tesseract 2.0如何設置Tesseract 2在C#中讀取單個字符?

在我的程序中,我只會承認大寫字母。

對於使用這個原因IM:

Tesseract ocr = new Tesseract(); 
ocr.SetVariable("tessedit_char_whitelist", "ABCDEFGHIJKLMNOPQRSTUVWXYZ"); 

所以在這一點上,我將傳遞一個大寫字母的圖像。 它工作退出很好,但有時它返回給我一個字符串與兩個字母。

Input: 
R 
Output: 
FE 

現在我需要知道如何設置頁面分割模式爲「單個字符」。以改善結果。

任何人都知道如何在C#中使用tesseract 2來做到這一點?

Becouse在Tesseract ocr對象中我只有SetVariable方法。 在版本的iOS API有這個方法來做到這一點:

setPageSegMode(TessBaseAPI.PSM_SINGLE_CHAR); 

任何人都可以幫我嗎?

回答

1

PSM僅適用於Tesseract 3.0x;因此,你需要一個兼容的.NET包裝器。有一個在https://github.com/charlesw/tesseract

+0

非常感謝您回覆我的問題。 簡單,簡短,很好的答案。 – Univers3 2013-04-10 00:12:41

+3

與上面的包裝你必須調用tesseract.Process(picture,Tesseract.PageSegMode.SingleChar);''' – h3n 2015-07-11 00:49:42

相關問題