2010-04-23 63 views
0

HI全部,附帶XML文件的PDF文件

我有一個附帶xml的PDF文件,我需要解析xml文件。有誰知道我是怎麼做到的? 我正在使用C#。

在此先感謝。

回答

0

我相信this blog post描述瞭如何使用C#從PDF文件讀取是你想要的。

這是他給從PDF文本抓取的例子:

using System; 
using org.pdfbox.pdmodel; 
using org.pdfbox.util; 

namespace PDFReader 
{ 
class Program 
{ 
    static void Main(string[] args) 
    { 
     PDDocument doc = PDDocument.load("lopreacamasa.pdf"); 
     PDFTextStripper pdfStripper = new PDFTextStripper(); 
     Console.Write(pdfStripper.getText(doc)); 
    } 
} 
} 

Here是什麼樣子的如何閱讀與C#的PDF文件的詳盡和高度的組織名單。

如果您需要的是嵌入式元數據的某種形式,正如Mark所建議的那樣,我相信使用我所鏈接的工具來獲取也是可能的。

0

嘗試使用LINQ to XML按照this中提出的問題。

+0

HI, 問題不是解析xml,而是訪問pdf中的xml。你知道我是怎麼做到的嗎? 謝謝, – Zorro 2010-04-23 18:08:03

+0

你能再描述一下情況嗎? XML究竟在哪裏? – 2010-04-23 18:13:58

+0

我認爲這個xml文件是嵌入在pdf文檔中的。 坦克 – Zorro 2010-04-26 09:02:32

0

PDF文件可以具有元數據信息對象,還是嵌入爲對象的XML文件?

+0

XML文件作爲對象嵌入。 謝謝 – Zorro 2010-04-26 09:01:50