2009-06-15 32 views
2

我有一個可保存的PDF文件,有一堆用戶將填寫的字段。從那裏我想通過將用戶輸入的字段提取到CVS文件來批處理這些文件。如何從PDF中提取用戶輸入的字段?

因爲我是一個.NET人,所以我看了PDFBox和iTextSharp。在PDFBox中,我能夠提取表單的文本,但不能提供用戶在字段中輸入的字段。雖然我可能是錯的,但這似乎並不是微不足道的。

有沒有更快的方法來完成這一任何其他語言?我聽說過一個Adobe SDK,接下來會進行研究,但到目前爲止我對此一無所知。或者是否有人知道如何完成我前面提到的庫的工作?

更新:沒有人知道任何開源或免費的圖書館?我這樣做更多的是對概念的證明,並且沒有幾個亟待解決的問題。

回答

0

雖然我沒有使用ASPOSE中的這個特定產品,但ASPOSE.Pdf.Kit組件會提取字段名稱和字段數據。

從他們literature

「你也可以閱讀PDF文檔的所有表單域,包括其名稱和值轉換成XML,FDF(表單數據格式)和XFDF文件。」

0

回頭看,這個(幾年前),你必須使用Acrobat Professional,而不是Acrobat Reader來填寫表格,以後可以回讀。我從來沒有理解過爲什麼你不能用Acrobat Reader做到這一點。

1

我強烈建議Tall Components PDF產品。我已經使用TallPDF.NET組件動態生成PDF。高分子PDFKit.Net可能會做你需要的一切。我沒有使用過這個特定的產品,但是如果它像TallPDF組件那麼它會很棒。儘管...相當昂貴,大約700美元的許可證。但他們有一個評估下載讓你試用。

相關問題