2013-04-26 58 views
0

我想以編程方式查找PDF中包含特定子字符串的所有頁面,如果他們這樣做,那麼我想用另一個PDF替換該頁面。替換頁面不是問題 - 我可以使用PHP的pdflib綁定或pdftk來完成。我不知道該怎麼做是如何測試以查看頁面是否包含特定的文本。如何查看PDF上的頁面是否包含特定文本

任何想法?

+0

取決於文本是否字面上是pdf,或者pdf只是文本的圖像......第一種情況很容易處理。另一個,不是很多。 – 2013-04-26 16:51:36

回答

1

我認爲你最好的選擇是用pdftk在單個頁面上分割PDF,然後用xpdf的pdftotext命令將內容轉換爲文本,然後用PHP或grep搜索結果文本。

相關問題