extacting pdf內容時保存textformat

我目前正試圖取代現有的具有特定格式[如表和東西]的PDF中的某些詞。我通過提取使用ITextSharp/c＃的單詞並保存到一個字符串中，成功地替換了單詞。後記，使用正則表達式應用替換操作。當我將這個結果保存爲pdf文件時，原始格式不會被保存。extacting pdf內容時保存textformat

我嘗試上傳到Google驅動器並將文件轉換爲文檔，但格式變得混亂。我正在考慮使用Acarbat SDK，但目前的版本安裝似乎搞砸了，不會讓我運行javascript

長話短說：我想知道如果Itextsharp具有功能提取文件的格式像一個CSS文件或有沒有更好做這個操作的方法。

2016-01-22 MJC

您可以從PDF中提取更多信息，但實際編輯時缺少某些信息，如段落的開始和結束，頁邊距，列邊框，表格單元格邊框等...... PDF不是用於編輯的格式。 – mkl

您是否看過iText的示例（http://developers.itextpdf.com/examples/itext-action-second-edition/chapter-15）以修改頁面內容和結構？這些例子使用Java，但轉換爲C＃應該相對簡單。

由於您的文檔格式化爲表格，這聽起來像是最有前途的方法，因爲更改文本不應該移動頁面上的其他文本。

2016-01-22 23:38:38 Herb

回答