2009-12-10 77 views
12

我試圖找到一種搜索PDF文件的方法。我來到PHP PDF課程,但我似乎無法找到任何讀取/搜索文件流的功能。使用PHP搜索PDF文件

所以,天真的我,我想簡單的使用file_get_contents()函數獲取流,顯然這是一個加密的狀輸出;)

所以我的問題,是有沒有辦法通過PDF文件中搜索?我正在尋找純腳本/免費/開源解決方案,而不是購買一些昂貴的商業軟件庫。

回答

11

XPDF

有一個博客帖子here可能會有所幫助。

似乎有一些代碼here,可以幫助 - 一個簡單的類讀取PDF成明文。不確定它是否支持解密。

PHP文檔中還有很多資源可以幫助您。 Click.

FPDF and FPDI may also help。在經過一番調查後,可能是您最好的選擇。**

+0

謝謝,明天我會檢查一下! +1 – Ben 2009-12-10 21:40:53

+0

我已經通過你所有的鏈接,發現所提到的類不支持加密。所以XPDF似乎被遺留下來了,因爲我正在使用windowsmachine並安裝了xampp,我將所有文件放在x:/ xampp/apache/bin/xpdf /目錄中。但我無法執行您發送的博文中提到的命令。有關如何正確設置XPDF的任何建議? (我對web服務器的瞭解不多......我甚至把這些文件放在正確的目錄中嗎?) – Ben 2009-12-12 08:23:20

11

大衛·沃爾什嘗試this article

+0

感謝您的快速回復,我會閱讀並嘗試!我會及時向大家發佈。 – Ben 2009-12-10 16:49:22

2

一個PHP的搜索引擎叫Sphider具有通過XPDF添加PDF搜索的選項。然後,您可以自定義結果模板以適應您網站的其他部分(如果適用)。

+0

該選項仍然需要安裝其他庫。 「下載並安裝pdftotext和catdoc並設置有位置(路徑)conf.php」只需要爲MS-Office文件 – jay 2009-12-10 16:59:20

+0

catdoc,pdftotext是XPDF的一部分,我注意到並在FAQ中提到,「索引PDF和doc文件「。 – akamike 2009-12-10 17:25:10

+0

感謝您的回答,爲您的努力+1,但不是我正在尋找的東西。謝謝。 – Ben 2009-12-10 21:40:18