2013-07-04 117 views
0

所以,我可以選擇從數據庫發送文檔以PDF或XPS打印。我需要能夠從這些格式之一中提取特定數據,例如名稱,日期等,並將該數據插入到單詞模板中。單詞模板不可編輯。您只能在字段中鍵入...每個字段都有一個標題,例如名稱,dob等。解析XPS或PDF並將數據插入到Word模板中?

基本上我需要能夠將該信息從PDF或XPS文件自動轉換爲單詞模板。

我對C++,Python和Java足夠熟悉......所以我沒有語言偏好 - 無論什麼工作完成。

你能提出一種我可以設法完成的方法嗎?我有點難以弄清楚我能從這些文件類型之一解析/提取數據的方式,以及哪種文件類型更適合。而且我絕對不知道如何在Word模板中自動化字段的人口。

哦,忘了提及,這是在Windows 7(也許8臺,但大多數是7臺)的機器。

預先感謝您的幫助!

+2

在本網站上搜索'[C++] parse pdf','[C++] word automation',並試用Google或Bing。這個問題範圍太廣泛了。這裏的問題應該是具體的,並且每個帖子只限於一個可回答的問題。你已經問了三個問題(解析PDF,解析XPS,填充一個Word模板),它們都太模糊而無法回答。 –

+0

@Ken White聽起來不錯,謝謝。 –

回答

0

這是任何人誰具有相同的排序問題,所以這是我做的:

我使用PDFBox的(http://pdfbox.apache.org/)解析文檔並提取所需要的數據,然後我用docx4j(http://www.docx4java.org/trac/docx4j )將數據插入單詞模板。兩者都是令人難以置信的工具,並擁有幾乎立即提供幫助的優秀社區

相關問題