需要從PDF線使用iTextSharp的提取文本行，並把輸入的線

-1

上每一個我的itextsharp library此功能，以提取線PDF文本行：需要從PDF線使用iTextSharp的提取文本行，並把輸入的線

PdfTextExtractor.GetTextFromPage(reader, page);

...但我需要把ENTER每行末尾 pdf即使有空行它應該讀空行。

來源

2013-05-06 shailendra

'PdfTextExtractor.GetTextFromPage' ** **不把結束行標誌在每次識別行的末尾（參見方法'了'LocationTextExtractionStrategy'的GetResultantText'：'sb.Append（ '\ n'）;'）。這就是說，在PDF中通常有*沒有**行結尾**或**行** *因此，如果iText的啓發式*將這些概念解釋爲PDF頁面內容*並不適合您，那麼您可能需要一個自定義的'TextExtractionStrategy'實現。如果您需要幫助，請提供更多詳細信息，尤其是您得到的內容，您想要的內容以及說明您的問題的樣本PDF。 – mkl 2013-05-06 08:59:30

@mkl的+1：在PDF中沒有「一行」這樣的東西，也沒有像「ENTER」這樣的東西。內容添加在絕對位置;它不是按行組織的。 – 2013-05-06 10:18:33

請通過以下鏈接：堆棧上溢的

來源

2013-05-06 06:10:28

歡迎來到Stack Overflow！雖然這可能在理論上回答這個問題，[這將是更可取的]（http://meta.stackexchange.com/q/8259）在這裏包括答案的重要部分，並提供供參考的鏈接。 – JJJ 2013-05-06 06:12:52

關於堆棧溢出鏈接：請明確說明您確實想要參考使用'PdfTextExtractor'類的答案。 – mkl 2013-05-06 08:47:52

讀入字符串變量然後分裂例如String page = PdfTextExtractor.getTextFromPage（reader，2）;

  String s1[]=page.split("\n");

來源

2013-05-09 12:48:11 adebayo

它不起作用。 – 2017-03-06 13:32:52

需要從PDF線使用iTextSharp的提取文本行，並把輸入的線

回答

相關問題