通過從圖像中找到文本的座標來提取文本區域

我正在開發一種圖像處理軟件，用於從手機相機拍攝的圖像中提取/裁剪並增強此裁剪的單頁形式。表單沒有矩形邊界簡化提取過程。是一種白色背景黑色文本格式，但除此之外沒有其他任何內容是固定的。現在有些文本將出現，這將驗證圖像是否爲必需的形式。所以我的問題是這些。通過從圖像中找到文本的座標來提取文本區域

1）我可以搜索特定的正則表達式使用leptonica庫本身還是我必須將焦點切換到其他圖書館像tessarect API做這樣

的this.So到目前爲止，我還沒有發現什麼2）現在，假設我知道左上角和右下角的文本，並且我可以成功搜索它。可以找到我正在搜索的特定文本的座標，然後相應地裁剪圖像？

2014-07-15 nnm

Leptonica對文本不做任何事情，它是一個圖像處理庫。

要啓用獲取文本的位置，請將tessedit_create_hocr 1添加到您的Tesseract配置文件（或者如果您將它用作庫來配置Tesseract，請設置此選項）。

結果不再是文本文件，而是UTF-8編碼的HTML文件（注意：它不是有效的XML）。其格式是不言自明的。它將包含輸入圖像上所有頁面上所有字的位置和尺寸（以像素爲單位）。您需要解析該HTML，找到您要查找的單詞，然後對這些單詞進行包圍。

2014-08-06 00:48:04

回答