我正在尋找解決方案來從pdf中刪除/刪除所有文本。我已經使用iTextSharp一段時間了,從PDF中提取文本很容易(在使用OCR的時候)。但是我找不到刪除文本的選項。從PDF中刪除文本
This solution坦率地說不適合我。
page.GetAsArray(PdfName.CONTENTS);
返回null對我來說,也使用PdfName.Text
時和其他一些我已經試過。
要使用的庫並不重要,我只是認爲iTextsharp應該能夠做到這一點。但是,如果有另一個(免費)解決方案,把它
編輯:只是爲了清楚,爲什麼我想從PDF文件
我想,以減少PDF文件的大小,刪除所有文本。我通過降低pdf中圖像的分辨率來做到這一點。然而,在很多情況下,矢量圖像佔據了大部分空間。所以我想到了以下內容: 刪除所有文本,而不是將剩餘的pdf(僅包含圖像和向量)轉換爲位圖(jpeg)。之後,我再次將文字粘貼在它上面。 另一種選擇是將文本隱藏,但我認爲這並不容易。
只是爲了澄清,你試圖刪除從PDF文本,但保留圖像的完整? –
準確地說,史蒂夫Czetty – Chumbawamba
爲了更清楚地說明:你想刪除所有可識別文本的痕跡,所以在它的地方是白色區域?或者你想將由字體組成的文本轉換成小光柵圖像,這樣copy'n'pa'ing同一文本不再工作(但讀取它仍然有效)?或者,將完整的PDF頁面轉換爲一個光柵圖像(而不是一組矢量對象),這樣copy'n'paste不再起作用了? –