2013-10-22 33 views
0

我有一個PDF文件。我想用(.doc/.docx/.xls)等文件中的其他文本替換此PDF文件的幾個段落。如何在同一PDF文檔中以明智或明智的方式掃描和編輯文本。如何在java中逐段或逐句替換PDF文件的內容。

非常感謝提前..

+0

嘗試apache pdfbox或itext庫。 – Nailgun

+2

您似乎認爲如果您修改PDF中的文本,它將以某種方式無縫集成到文檔中。 PDF就像已經佈置的印刷頁面。關於頁面佈局的決定(例如文本框)是由最初編寫PDF的程序製作的。儘管您可以使用PDFBox或iText進行小的更改,但不要指望頁面格式和文本流程可以神奇地適應新文本。 PDF就像一個打印頁面。您可以應用一些白紙或剪切/粘貼一些紙張更正,但佈局不會調整。 –

回答

0

你可以使用PDFBox的庫(http://pdfbox.apache.org/)來提取PDF文本,並使用HSSF庫提取字中的數據或Excel文件。然後,您可以完成所有操作,並最終用更新的文本數據創建新的PDF文檔。

+0

如果替換物使用與原始物體大致相同的空間,那麼*可能*就像您發出聲音一樣容易。但是,如果沒有,我們正在談論重新流動整個文件。如果是不規則的列,嵌入到段落中的圖像,應用於文本序列的註釋,頁面裝飾等......這一切都很簡單。通過HSSF/apache POI獲取數據的 – mkl

+0

沒問題。但是通過iText或PDF Box api替換PDF文本是不可能的。任何其他想法都是非常可觀的。 – siman

+0

讓我們用一個問題回答你的問題。我給你一個印刷頁面。我要求你插入這個長段代替我突出顯示的兩個詞。你手中的所有東西都是紙。你將如何實現它? –