上每一個我的itextsharp library
此功能,以提取線PDF文本行:需要從PDF線使用iTextSharp的提取文本行,並把輸入的線
PdfTextExtractor.GetTextFromPage(reader, page);
...但我需要把ENTER
每行末尾 pdf即使有空行它應該讀空行。
上每一個我的itextsharp library
此功能,以提取線PDF文本行:需要從PDF線使用iTextSharp的提取文本行,並把輸入的線
PdfTextExtractor.GetTextFromPage(reader, page);
...但我需要把ENTER
每行末尾 pdf即使有空行它應該讀空行。
請通過以下鏈接:堆棧上溢的
讀入字符串變量然後分裂 例如String page = PdfTextExtractor.getTextFromPage(reader,2);
String s1[]=page.split("\n");
它不起作用。 – 2017-03-06 13:32:52
'PdfTextExtractor.GetTextFromPage' ** **不把結束行標誌在每次識別行的末尾(參見方法'了'LocationTextExtractionStrategy'的GetResultantText':'sb.Append( '\ n');')。這就是說,在PDF中通常有*沒有**行結尾**或**行** *因此,如果iText的啓發式*將這些概念解釋爲PDF頁面內容*並不適合您,那麼您可能需要一個自定義的'TextExtractionStrategy'實現。如果您需要幫助,請提供更多詳細信息,尤其是您得到的內容,您想要的內容以及說明您的問題的樣本PDF。 – mkl 2013-05-06 08:59:30
@mkl的+1:在PDF中沒有「一行」這樣的東西,也沒有像「ENTER」這樣的東西。內容添加在絕對位置;它不是按行組織的。 – 2013-05-06 10:18:33