2013-06-04 37 views
2

我正在研究Objective-C中的OCR應用程序。到目前爲止,我的圖像識別工作還算不錯,但我有興趣檢測行/行,以獲得更好,更好的結果。Tesseract檢測線

我的項目中有tesseract庫和leptonica庫。我看着baseapi.h爲正方體,我相信我所尋找的是叫

Boxa* GetTextlines(Pixa** pixa, int** blockids); 

我不知道怎麼我的項目中,或者是否是正確的功能我尋求使用此功能的作用。任何人都可以提供有關此事的任何見解?

謝謝!

回答

0

檢測頁面元素(例如塊,段落,行,單詞等)的標準方法是使用PageIterator類。我不知道如何在Objective-C中做到這一點,但這裏有一個C++示例代碼供參考:

tesseract::ResultIterator* ri = tess->GetIterator(); 
while (ri->Next(tesseract::RIL_LINE)) { 
    // Do whatever you want with that line 
    // Recognize line's text 
    char* ctext = ri->GetUTF8Text(tesseract::RIL_LINE); 
    // Get line's bounding box 
    ri->BoundingBox(tesseract::RIL_WORD, &left, &top, &right, &bottom); 
}