我需要閱讀複雜PDF中的某些部分。我搜索了網絡,有人說FPDF是好的,但它不能閱讀PDF,它只能寫。有沒有一個lib允許獲得給定PDF的某些內容?用PHP閱讀PDF的內容?
如果不是,讀取給定PDF的某些部分是一種好方法嗎?
謝謝!
我需要閱讀複雜PDF中的某些部分。我搜索了網絡,有人說FPDF是好的,但它不能閱讀PDF,它只能寫。有沒有一個lib允許獲得給定PDF的某些內容?用PHP閱讀PDF的內容?
如果不是,讀取給定PDF的某些部分是一種好方法嗎?
謝謝!
我在這裏看到的兩個解決方案:
https://whatisprymas.wordpress.com/2010/04/28/lucene-how-to-index-pdf-files/
那該怎麼辦?
http://www.phpclasses.org/package/702-PHP-Searches-pdf-documents-for-text.html
PS:我沒有測試這個類,只是閱讀說明。
那麼,我必須註冊才能得到它......但謝謝! – EOB 2012-01-12 13:46:47
免費且簡單的註冊。 – 2012-01-12 19:36:16
$result = pdf2text ('sample.pdf');
echo "<pre>$result</pre>";
如何獲得「乾淨」的文本:source code pdf2text
http://webcheatsheet.com/php/reading_clean_text_from_pdf.php
你如何定義 '某些部分'?按頁面?通過文檔上的座標位置?等等; – Jakub 2012-01-12 13:42:25
不確定我自己,我不熟悉PDF結構... Illproly將其轉換爲文本之前,並解析,使用一些正則表達式。 – EOB 2012-01-12 13:46:07