1
我有一個包含如姓名,電話號碼,我想認識這些字段中的數據並將它們保存到數據庫地址等不同領域形式的圖像。現在,我的OCR工作正常,但我不知道如何從圖像中提取用於OCR的特定字段數據(名稱,地址)。只是我想知道如何識別輸出文件中的字符來自名稱字段或地址字段或任何其他字段。
我有一個包含如姓名,電話號碼,我想認識這些字段中的數據並將它們保存到數據庫地址等不同領域形式的圖像。現在,我的OCR工作正常,但我不知道如何從圖像中提取用於OCR的特定字段數據(名稱,地址)。只是我想知道如何識別輸出文件中的字符來自名稱字段或地址字段或任何其他字段。
既然您知道不同的字段將在表單的確切區域,您可以使用一些圖像處理庫裁剪圖像,並只發送特定區域到OCR引擎。
是的,但是如何在精確區域自動完成裁剪。請告訴我沒有裁剪圖像的解決方案,只提取帶有標題或名稱的字段??? –
由於表單總是看起來一樣,掃描一個示例窗體,並在Paint.NET或類似的東西中打開圖像。您將能夠找到名稱/標題框的確切座標。 – Osiris
哇謝謝,這真的很有幫助。但只要告訴我如何做到這一點,而不是裁剪,只是使用領域的標題。再次非常感謝你 –