2014-03-04 22 views
0

我正在開發一個項目,該項目要求我將打印參考書目(近14000項)與數字目錄/數據庫進行比較。是否有可能 1.掃描參考書目​​, 2.通過OCR程序運行, 3.(可選)將掃描的文件轉換爲電子表格 4.將該信息與庫目錄進行比較,即查看是否參考書目中的項目出現在目錄集合中?已掃描的文檔和數據庫查詢

這將大大減少此項目目前需要的時間。

回答

0

是的,這是絕對有可能的。

這是一個非常有趣的項目,不尋常,需要一些MacGyver。

您描述的步驟是正確的。請記住,爲了使OCR結果的最大自動化計劃不完美,所以您的搜索算法應該具有一定的靈活性和模糊性,足以應對OCR偶爾出現的錯誤,但足以確保不會導致誤報。