2015-11-24 55 views
0

有沒有辦法讓我通過突出顯示所需的字段來掃描PDF圖像並從圖像中提取數據?我們每天掃描數以千計的房地產行爲的PDF圖像,並希望能夠自動完成數據錄入過程。我們面臨的問題是沒有兩個行爲是相同的。PDF數據提取

+1

你在這裏新來的,因爲我想念你遇到的代碼和錯誤。請閱讀如何問問http://stackoverflow.com/help/how-to-ask以及如何創建一個最小化,完整和可驗證的示例http://stackoverflow.com/help/mcve。 – davejal

回答

0

它已在評論中說,Stackoverflow主要是關於編程問題。

儘管如此,根據實際文件和要處理的卷有可能。

在高端,有一種名爲Teleform的產品,最初由卡迪夫開發,現在由惠普擁有,用於處理紙張表格;您還可以查看Business Process應用程序Cardiff LiquidOffice,現在是HP LiquidOffice。

在低端,我開發了一個PDF格式的應用程序,使用Acrobat運行,可以掃描和OCRd格式,並將數據傳輸到一個專門準備好的可填寫表格,從那裏可以將數據導出爲數據庫,例如。欲瞭解更多信息,演示和報價,請隨時與我聯繫私下。

如果你想用Acrobat開發一些東西,你也可以從OCRd文檔開始,然後使用Redaction函數的功能(或者使用Appligent的工業強度編輯工具Redax)來查找關鍵字,然後使用這些關鍵字的位置信息提取更多的數據。