3
我想弄清楚如何使用Leptonica庫提供的分割器進行文檔分析。我一直在尋找pageseg.c,但我不認爲我完全理解它:(!使用Leptonica進行字符分割
如果我把圖像和加載它作爲PIX數據類型,我調用pixGetRegionsBinary()來找到每個符號是然後我用文字塊面膜,提取每個符號分別
如果我理解正確的話我會有這樣的代碼:??
Pix* page = pixRead("myImage.tif");
Pix** halftone;
Pix** textline;
Pix** textblock;
if (pixGetRegionsBinary(page, halftone, textline, textblock, 0))
{
//..error message
}
現在是文本塊的所有字符或我使用我的錯誤的分割方法:)?另外我怎麼會知道什麼時候textblock「數組」結束?
在此先感謝!
編輯26/11/2013
任何有興趣 - Leptonica Doxygen Documentation - Page Segmentation是整版分割的一個很好的例子!字符分割的