2011-09-14 68 views
9

我們正在開發基於MySQL的PHP​​ &應用程序。我們分發PDF格式的註冊表格。填寫表格後,用戶將上傳PDF表格到我們的申請註冊。我們希望從PHP中提取PDF格式的註冊數據並將這些數據保存到數據庫中。如何在PHP中從PDF表格中提取字段值

有人可以指向我從PHP表格中提取字段值的PHP類嗎?

+0

據我所知這是不可能的。你需要使用OCR才能正常工作(所以確實可行;)):http://en.wikipedia.org/wiki/Optical_character_recognition – hoppa

+1

謝謝@hoppa。註冊表單不是PDF格式的圖像。它是可填寫的PDF格式。請檢查一下。 http://www.adobe.com/products/acrobatpro/create-fillable-pdf-forms.html –

+0

另請參閱http://stackoverflow.com/questions/6713701/populating-pdf-form-fields-with-php OP使用PHP來填寫表單域,也許你可以調整它的代碼來閱讀它們。 – Fabio

回答

4

一種替代可以是使用外部程序等http://www.pdflabs.com/tools/pdftk-the-pdf-toolkit/等類似:

$ pdftk file.pdf dump_data_fields 

,然後處理輸出。但是,這會涉及到很多解析邏輯和輸出處理。另外,如果您無法在服務器上安裝二進制文件,請放心。 :)

作爲hoppa提到可能會更簡單。

編輯:此問題可能是The best pratice to parse PDF forms fields with PHP5的重複,該問題有一個有趣的評論!