0
我想從tesseract中提取文本文檔的樣式信息。這些樣式信息包括有關標題,子標題,文本樣式的信息,如粗體,斜體和下劃線。tesseract代碼的哪一部分向我提供了這些信息?有沒有辦法從tesseract中提取文檔的樣式信息?
我想從tesseract中提取文本文檔的樣式信息。這些樣式信息包括有關標題,子標題,文本樣式的信息,如粗體,斜體和下劃線。tesseract代碼的哪一部分向我提供了這些信息?有沒有辦法從tesseract中提取文檔的樣式信息?
ResultIterator
類有WordFontAttributes
產生字體信息的方法。
如何從tesseract中獲取該信息?我希望文檔圖像中每行的布爾值。 – 2014-09-12 16:17:26
請參閱[API示例](https://code.google.com/p/tesseract-ocr/wiki/APIExample)&[Java示例](http://sourceforge.net/p/tess4j/code/HEAD/tree/ Tess4J_3 /主幹/測試/網/ sourceforge上/ tess4j/TessAPITest.java)。 – nguyenq 2014-09-13 17:03:34