2014-02-09 93 views
4

我想爲商店票據(Java)編寫一個OCR代碼,我用圖像字典距離獲得了很好的結果,但是對於傾斜的文本或不好的掃描結果。我聽說神經元網絡是完美的。OCR和神經網絡?

問題:你推薦哪種類型的神經網絡用於商店門票字符檢測?

THKS

回答

3

神經網絡不會神奇地解決問題爲您服務。他們會有類似的問題,你目前的做法。在發送給分類器之前,您很可能必須檢測歪斜並進行糾正。

與不良掃描類似。這取決於一個壞的掃描是什麼。例如,一些神經網絡在糾正模糊(未聚焦圖像,移動模糊,...)方面效率非常高。

看看有關OCR和神經網絡的一些論文。這是一個經典的話題,所以有很多。例如,The Anatomy of Bangla OCR System for Printed Texts Using Back Propagation Neural Network也嘗試在運行神經網絡之前解決傾斜圖像的問題。

我知道遞歸神經網絡可以用於OCR。即使是非常簡單的人也能輕鬆識別簡單的字符。最近有一篇文章改進了它們:High-Performance OCR forPrinted English and Fraktur using LSTM Networks。他們甚至包括文本行標準化,這對你的情況可能非常有用。

注意,有一個答案在這裏有關培訓OCR正常前饋BP神經網絡太:training feedforward neural network for OCR

1

「卷積神經網絡」與「深度學習」已被證明給予一定的最好的結果在OCR(特別是在MNIST數據庫)。

一個好的起點是this tutorial