1

我想從圖像收據中提取總帳單。我可以提取圖像中存在的全部數據,但現在我只能提取我需要的信息。ADHoc信息檢索

這是我有的圖像。

enter image description here

我從圖像

m cm lnnk 3mm: :33; no 1 z m 
x Visut all! ms「; (or nulnunn mfn an an: nan. 



Sub Iota] 19.56 
TOTAL 19.56 
VISA 1956 
Fun 19.56 
D!!! You Know 0 



For ureat-tastlru dessens under 200 
cahries, try our Triple Berry Frozen 
Yogurt Sunda: a dish of Frozen Yogurt. 
or a Vanma rozen Vugurt Done. 

粘貼所提取的信息從這個數據我只是想提取的總賬單。爲了得到這個,我發現我可以使用Ad Hoc Normalization(Adhoc retrieval)。有人可以提供關於臨時檢索的任何見解。如果還有其他選項可以從圖像中提取數據,請讓我這樣做。我正在使用tesseract來提取這些信息。有時它不會給出正確的輸出。我可以用一些幫助來即興創作tesseract給出的輸出。

+0

你可以添加更多的信息嗎?期望的輸出是「19.56」嗎?這是否需要在多個帳單上運行? – shiri

回答

0

爲什麼在這種情況下需要臨時檢索?由於您從收據中獲得OCR結果,因此您可以簡單地對出現在「TOTAL」旁邊的項目執行常規文本搜索。

有圖像文本搜索的算法,但這似乎是這樣一個直截了當的應用程序的矯枉過正,除非有充分的理由這樣做。