2012-07-08 31 views
0

我正在嘗試開發和算法閱讀草書手寫(醫生的手寫是確切的)。我不需要匹配每一個字母,只是可識別的字母(我使用的是字典方式)。Java OCR:閱讀草書手寫

現在,我有BufferedImage類中的二值化圖像。接下來我需要做的是隔離每個角色。

你能提供我一個關於如何實現這一點的僞代碼?我想在使用其他庫時很少。我想通過學習如何實現每個過程來做到這一點。任何提示?

+0

我認爲醫生的筆跡在定義上難以辨認 - 即使對於人類... – thkala 2012-07-08 06:56:28

+0

@thkala好,有些字符是可讀的。有一個藥品名稱的字典,這個算法可以幫助識別處方上的特定藥物。 – Ruel 2012-07-08 07:00:33

回答

2

您需要了解的Image Moments的東西,從而可以用來比較的圖像,即使他們已經旋轉或縮放

您需要重的數學背景,以瞭解如何做到這一點,您可以通過以下方式啓動閱讀這個http://www.ias.ac.in/sadhana/Pdf2007Oct/521,它是關於如何實現一個特定類型的字符(卡納達)OCR,相同的一般原則應適用於你正在嘗試做什麼

除非你願意花幾個月(或幾年)在這個追求中,我會建議你使用已有的東西,比如ocropusjavaocr

1

或者,您可以從Vision Objects購買HWR SDK,這將大大減少您的開發工作量。