2016-01-22 39 views
0

我目前正試圖取代現有的具有特定格式[如表和東西]的PDF中的某些詞。我通過提取使用ITextSharp/c#的單詞並保存到一個字符串中,成功地替換了單詞。後記,使用正則表達式應用替換操作。當我將這個結果保存爲pdf文件時,原始格式不會被保存。extacting pdf內容時保存textformat

我嘗試上傳到Google驅動器並將文件轉換爲文檔,但格式變得混亂。我正在考慮使用Acarbat SDK,但目前的版本安裝似乎搞砸了,不會讓我運行javascript

長話短說:我想知道如果Itextsharp具有功能提取文件的格式像一個CSS文件或有沒有更好做這個操作的方法。

+2

您可以從PDF中提取更多信息,但實際編輯時缺少某些信息,如段落的開始和結束,頁邊距,列邊框,表格單元格邊框等...... PDF不是用於編輯的格式。 – mkl

回答