0
我正在使用接收發票中所有文本的應用程序(通過處理該發票的掃描圖像來獲取文本)。現在,因爲有幾種可用的發票格式,所以我需要對應用程序接收的格式進行分類。例如,某些格式可能包含單位數量,有些則不包含(但它們都具有總成本)。發票格式識別器
我做了一些關於解析技術的研究,但沒有找到可行的解決方案。你對這類問題有什麼建議嗎?
我正在使用接收發票中所有文本的應用程序(通過處理該發票的掃描圖像來獲取文本)。現在,因爲有幾種可用的發票格式,所以我需要對應用程序接收的格式進行分類。例如,某些格式可能包含單位數量,有些則不包含(但它們都具有總成本)。發票格式識別器
我做了一些關於解析技術的研究,但沒有找到可行的解決方案。你對這類問題有什麼建議嗎?
在Perl中,您可以使用Marpa,一個通用的BNF解析器 - 在BNF中描述您的發票格式,Marpa會解析您的BNF發票,參見例如。它是如何解決這個complex example與這simple code。
學習使用ANTLR。 – 2015-01-09 19:09:27