2012-11-27 87 views
1

我想讀每行一個PDF文件行,但我想保持他原來的格式iTextSharp的和pdf

¿我可以做到這一點與iTextSharp的?

我用下面的代碼:

private void button1_Click(object sender, EventArgs e) 
     { 

      string text = string.Empty; 
      string path = string.Empty; 
      path = "C:\\Documents and Settings\\Rafael\\Desktop\\Imprimiendo\\Print1.pdf"; 
      PdfReader reader = new PdfReader(path); 

      for (int page = 1; page <= reader.NumberOfPages; page++) 
      { 
       text = PdfTextExtractor.GetTextFromPage(reader, page); 
       richTextBox1.Text = text; 

      } 
      reader.Close(); 
      return; 
     } 

感謝,我真的很需要你的幫助

+0

你是什麼意思閱讀每​​行一個PDF文件行?你想要維護什麼格式?在您的示例代碼中,您使用僅提取文本的文本提取器,沒有別的,特別是沒有格式信息。不久之前有人談論過富文本提取策略...... – mkl

+0

我需要閱讀pdf文件,但與原始格式,我不知道很多關於itextsharp這就是爲什麼我需要幫助 –

+0

什麼'格式'你的意思是?你的意思是字體和樣式信息?或者你是指單詞的順序,例如尊重多欄文字? – mkl

回答

1

如果你想讀在它小的數據PDF文件,iTextSharp的將是最好的選擇,也許找到答案在這裏:但是

Reading PDF content with itextsharp dll in VB.NET or C#

,如果你在PDF文件中有大量的數據,iTextSharp的將在實現這一任務的問題。在這種情況下,您可能需要第三方庫。這篇文章可以幫助你多少:

Read PDF file in C#

+0

希望它可以幫助你! – 2012-12-05 01:19:55