2008-10-21 74 views
16

如何才能以編程方式搜索並替換大量PDF文件中的某些文本?我想刪除已添加到一組文件的URL。我已經能夠在Adobe Pro的批處理中使用JavaScript刪除鏈接,但鏈接文本仍然存在。我已經看到建議使用文本修改,它可以手動工作,但我不想手動修改1300個文件。如何編程文本搜索並替換爲PDF文件

+0

我知道它確實很舊,但我遇到了這個問題,而且您是第一個結果在谷歌。最後你用了什麼? – Elric 2015-01-28 19:10:48

+0

我使用Perl,CAM :: PDF模塊以及Chris Dolan的答案中提供的示例changepagestring.pl程序。這是一次性的事情,所以不要問我現在該怎麼做;-) – rpilkey 2015-01-29 14:05:19

回答

14

由於文檔格式的圖形性質,在PDF中查找文本本質上很難 - 您正在搜索的字母在文件中可能不是連續的。也就是說,CAM::PDF有一些搜索替換功能和啓發式。試試changepagestring.pl,看看它是否適用於您的PDF。

+1

非常感謝克里斯,爲答案和CPAN上的模塊。這對我來說很好。希望谷歌拿起這個頁面,我沒有在我的搜索中看到CAM :: PDF模塊。 Roger – rpilkey 2008-10-21 18:26:03

4

我也變得絕望了。經過10 PDF編輯器的安裝,所有的成本錢,沒有成功:

PDFTK +編輯器就夠了:

在PDF替換文本文件

  • 使用PDFTK解壓縮PDF頁面 流

    pdftk original.pdf output original.clear.pdf uncompress

  • 替換文字(有時候這是 的作品,有時候不會)。

  • 修復修飾(和現在碎) PDF

    PDFTK original.clear.pdf輸出original.clear.fixed.pdf

(喬爾敢)

2

不知道我想要做的所有工作,編寫代碼來修改你的1300個文件時,有一個程序,它可以爲你做。有一天,我使用專業版的Infix通過「在文件中查找和替換」功能批量修改近100個文件。它效果很好。我已經評估過其他程序,希望找到類似於Microsoft Word的查找和替換功能。 Infix是我發現可以做到的唯一一個。退房時間:http://www.iceni.com/infix-pro.htm

1

我剛剛完成了一個由帶有變音符號的文本組成的文本的中綴,希望能夠生成另一個文本,其中帶有雙音節和組合變音符的字符被替換爲單個變音符號。 Infix對於那些不理解程序解決方案工作的麻煩的人來說絕對是一個很好的解決方案。所有請求更改都已生效。仍然需要了解如何影響改變文本佈局的單詞的重排。

1

這只是解決方案的一半,但我使用了Touch,結合AppleScript支持發送擊鍵來替換數千個表格單元格中的字符串。取決於你的頁面佈局如何,它可以爲你工作。在我的情況下,我不得不手動插入光標在每個表的開始處(數十個表格 - 對於手動過程非常易於管理),但是之後我自動替換了數千個單元格。

1

的問題是一個綱領性的解決方案,但我仍然會分享這個免費的在線工具,它幫助了一些PDF文件,我的質量替換文本:

http://www.pdfdu.com/pdf-replace-text.aspx

我沒有看到任何廣告或其他修改在替換文本後生成的PDF文件中。

我無法使用我試過的軟件在本地進行更改。我認爲主要的問題是我錯過了PDF中使用的字體,即使使用Acrobat Pro,它也無法正常工作。在線工具沒有抱怨,併產生了很好的結果。

0

我建議你可以使用VeryPDF PDF文本代用品命令行軟件批量的PDF頁面替換文本,您可以運行pdftr.exe輕鬆替換PDF頁面的文本,例如,

pdftr.exe -contentreplace 「My Name => Your Name」D:\ in.pdf D:\ out.pdf

pdftr.exe -searchandoverlaytext「My Name => Your Name」D:\ in.pdf D:\ out.pdf

pdftr.exe -searchandoverlaytext 「我的名字=> d:\ TEMP \ myname.png * 20 * 20」 d:\ in.pdf d:\ out.pdf

pdftr.exe -pagerange 1-3 -contentreplace「Old Text => New Text || VeryPDF => VeryDOC ||我的名字=>您的姓名」D:\ in.pdf D:\ out.pdf

pdftr .EXE -searchtext 「字符串」 C:\ in.pdf

pdftr.exe -pagerange 1個-searchtext 「字符串」 C:\ in.pdf

pdftr.exe -pagerange 1個-searchandoverlaytext「老文本= >新文本|| VeryPDF => VeryDOC ||我的名字=>您的姓名「D:\ in.pdf D:\ out.pdf

pdftr.exe -overlaytextfontname」Arial「-overlaytextcolor FF0000 -overlaybgcolor 00FF00 -searchandoverlaytext 「舊文本=>新文本|| VeryPDF => VeryDOC ||我的名字=> Y我們的名字「D:\ in.pdf D:\ out.pdf

pdftr.exe -opw 123 -upw 456 -contentreplace」Old Text => New Text || VeryPDF => VeryDOC || My Name => Your名稱」 d:\ in.pdf d:\ out.pdf

pdftr.exe -searchandoverlaytext 「PDFcamp打印機=> VeryPDF打印機」 -overlaytextfontsize 8 d:\ in.pdf d:\ out.pdf

pdftr.exe -searchandoverlaytext「PDFcamp Printer => VeryPDF Printer」-overlaytextfontsize 80%D:\ in.pdf D:\ out.pdf