我正在進行會計申請。用戶將在應用程序中上傳所需的pdf或doc銀行對賬單。我需要讀取/解析文檔並在數據庫中插入金額/支票號碼等(根據我的數據庫結構)。通過PHP解析PDF/DOC銀行對賬單
請幫助實現相同。
我正在進行會計申請。用戶將在應用程序中上傳所需的pdf或doc銀行對賬單。我需要讀取/解析文檔並在數據庫中插入金額/支票號碼等(根據我的數據庫結構)。通過PHP解析PDF/DOC銀行對賬單
請幫助實現相同。
PDF是爲了表示,而不是使用裏面的數據。
您可能會喜歡pdftotext
或catdoc
。
我已經在這個問題上工作了2個多星期了,我不得不說這是一個相當的任務。我在尋找一個php類來提取文本方面取得了一些成功,但問題在於,它不適用於每個版本的.pdf格式。自己鼓起來需要花一些時間來弄清楚編碼和壓縮問題。現在我正在看一些python庫。現在從頭開始編寫其中的一個太費時了。
你在看哪些python庫?他們有任何幫助嗎? – pranshus 2017-09-27 07:31:30
你卡在哪裏?打開.doc或.pdf文件?解析提取的文本?你有嘗試過什麼嗎? – deceze 2011-03-02 07:09:17
您需要意識到這是一個*巨大的*,非平凡的任務,需要大量的工作,並且可能永遠達不到完全自動化。還有,@deceze說這裏有幾個問題,你需要將問題分解成 – 2011-03-02 07:09:55
我還沒有嘗試過任何東西,我只需要一種方法來開始 – 2011-03-02 09:22:41