我正在爲我正在編寫的應用程序使用Tesseract OCR。我只是想從我時常得到的照片中識別出某些區域的文字。基本調用此刻工作高級使用Tesseract OCR
tesseract::TessBaseAPI api;
api.SetPageSegMode(tesseract::PSM_AUTO); // Segmentation on auto
api.Init("/usr/local/share/","eng"); // path = parent directory of tessdata
pFile = fopen("home/myname/test.bmp","r"); // Open picture
PIX* image; // Image format from leptonica
image = pixReadStreamBmp(pFile);
fclose(pFile);
api.SetImage(image); // Run the OCR
char* textOutput = new char[512];
textOutput =api.GetUTF8Text(); // Get the text
到目前爲止,此代碼工作正常。但是在某些時候,OCR並不像我希望的那樣精確。實際上,我不想爲我的目的培訓一門新語言,所以我想知道是否有可能通過某些API調用提高準確度? 也許這裏有一些建議! 問候
托比亞斯
如果你想要比這更精確,那麼你可以在pixeRead()中傳遞OTSU閾值圖像。我正在pixRead()中傳遞正常圖像。通過OTSU閾值圖像。我爲此開發了算法。 。讓我知道是否有人想要。 – 2016-06-24 07:44:43