2013-12-10 38 views
0

我有一些掃描的內容項正在被掃描儀&轉換成pdf /圖像,最後被存儲在露天存儲庫中。如何閱讀在戶外掃描內容中的內容?

我可以使用元數據屬性搜索這些掃描的項目,但任何人可以幫助我如何我可以搜索他們存儲直通到掃描的文檔內容。例如。我已經掃描了填寫用戶詳細信息的表單&我想用該用戶的名稱搜索到戶外。

這怎麼可能?有沒有辦法讓它儘可能靠近掃描儀端?

回答

1

我可以整合&使用的Kofax &掃描內容這種整合可以自動捕捉到所有細節,包括掃描的內容文本內容將在自動自定義內容模型,該模型具有映射到這些領域而這種模式連接到掃描填寫內容。一旦完成,它就屬於露天索引的範圍,之後用戶可以搜索相同的索引。

此外,我還假設kofax提供了諸如掃描,虛擬ReScan(VRS),識別(OCR/OMR/ICR),驗證,驗證,質量控制,PDF生成器等許多組件,這些組件可用OOTB,但我們需要配置這些用於我們的實施。例如。通過配置質量模塊,我們可以看到掃描內容時產生的錯誤。另外,因爲我找露天+的Kofax整合,所以我認爲會通過的Kofax開箱即用的&提供這些功能,我只是需要映射掃描的內容,以露天內容存儲庫用於存儲內容&元數據按照定義內容模型。

+0

同時將所有掃描的內容製作爲pdf可以簡化單獨存儲掃描內容文本的任務。一旦內容被掃描並轉換成pdf,最後存儲在戶外回購站中,露天可以自動索引所有這樣的pdf內容。 – Finn

1

使用EpheSoft或爲的Kofax掃描軟件。兩款產品都與Alfresco集成,可以自動識別字段並將其映射到Alfresco模型。

經過這個過程已經完成,你可以在這些特定的字段進行搜索。

+0

意味着我可以使用的Kofax/ephesoft掃描內容&這種整合可以自動捕捉所有詳情,包括的掃描內容的文字內容,這將在自動定製內容模型,其具有映射到所有這些字段和該模型被附接到掃描被填充內容。一旦完成,它就屬於露天索引的範圍,之後用戶可以搜索相同的索引。 – Finn

+0

是的!所以首先你需要在Alfresco中定義一個你想要的領域的模型。然後,您需要在掃描軟件中定義一個模板,然後您需要進行映射。 –

0

有許多選項可供您探索,但它們都需要在掃描的內容上執行OCR,並且從OCR中提取的文本需要存儲在PDF中(如果您使用的是PDF)或者它需要作爲元數據或全文存儲在Alfresco中。

如果您將OCR文本存儲在PDF中,則只要所使用的內容類型指定您將索引內容的全文,Alfresco就能夠使用其內容轉換器提取文本。

現在有很多選項可用於完成您的操作,但要使解決方案接近掃描儀,您需要研究一種捕獲解決方案,如Ephesoft,該解決方案用於智能文檔捕獲和處理。其他解決方案可用(如Kofax),或者您可以使用Tesseract實施您自己的解決方案。

+0

我希望我可以假設OCR只能在掃描儀的端部使用並使用自定義內容模型,我可以將此OCR文本附加到掃描的內容或掃描解決方案(如ephesoft或kofax)提供這些功能。 – Finn