我有一個PDF文件。我想用(.doc/.docx/.xls)等文件中的其他文本替換此PDF文件的幾個段落。如何在同一PDF文檔中以明智或明智的方式掃描和編輯文本。如何在java中逐段或逐句替換PDF文件的內容。
非常感謝提前..
我有一個PDF文件。我想用(.doc/.docx/.xls)等文件中的其他文本替換此PDF文件的幾個段落。如何在同一PDF文檔中以明智或明智的方式掃描和編輯文本。如何在java中逐段或逐句替換PDF文件的內容。
非常感謝提前..
你可以使用PDFBox的庫(http://pdfbox.apache.org/)來提取PDF文本,並使用HSSF庫提取字中的數據或Excel文件。然後,您可以完成所有操作,並最終用更新的文本數據創建新的PDF文檔。
嘗試apache pdfbox或itext庫。 – Nailgun
您似乎認爲如果您修改PDF中的文本,它將以某種方式無縫集成到文檔中。 PDF就像已經佈置的印刷頁面。關於頁面佈局的決定(例如文本框)是由最初編寫PDF的程序製作的。儘管您可以使用PDFBox或iText進行小的更改,但不要指望頁面格式和文本流程可以神奇地適應新文本。 PDF就像一個打印頁面。您可以應用一些白紙或剪切/粘貼一些紙張更正,但佈局不會調整。 –