2014-07-15 54 views
0

我正在開發一種圖像處理軟件,用於從手機相機拍攝的圖像中提取/裁剪並增強此裁剪的單頁形式。表單沒有矩形邊界簡化提取過程。是一種白色背景黑色文本格式,但除此之外沒有其他任何內容是固定的。現在有些文本將出現,這將驗證圖像是否爲必需的形式。所以我的問題是這些。通過從圖像中找到文本的座標來提取文本區域

1)我可以搜索特定的正則表達式使用leptonica庫本身還是我必須將焦點切換到其他圖書館像tessarect API做這樣

的this.So到目前爲止,我還沒有發現什麼2)現在,假設我知道左上角和右下角的文本,並且我可以成功搜索它。可以找到我正在搜索的特定文本的座標,然後相應地裁剪圖像?

回答

0

Leptonica對文本不做任何事情,它是一個圖像處理庫。

要啓用獲取文本的位置,請將tessedit_create_hocr 1添加到您的Tesseract配置文件(或者如果您將它用作庫來配置Tesseract,請設置此選項)。

結果不再是文本文件,而是UTF-8編碼的HTML文件(注意:它不是有效的XML)。其格式是不言自明的。它將包含輸入圖像上所有頁面上所有字的位置和尺寸(以像素爲單位)。您需要解析該HTML,找到您要查找的單詞,然後對這些單詞進行包圍。