2012-08-31 26 views
1

我最近在coursera上開設了機器學習課程,並通過了體面分數的課程。我在課程中使用了KNN,Logistic迴歸,NN等算法,其中一項任務是編寫能夠完成的數字識別學習算法。課程最後以Photo OCR的案例研究結束,這讓我非常興奮,但是我發現很難將課程中教授的基本算法應用於這個巨大的問題。所以任何人都可以在Photo OCR上提供一些算法嗎?機器學習中的照片OCR算法

回答

3

圖像識別的問題在於它對任何變化都非常敏感。他們的平均人類大腦能夠從圖像中提取某些特徵,即使某些圖像操作(如傾斜,旋轉等)已被應用,也可以讓我們識別給定的圖像。

這就是說,據我所知,人工神經Netwoks是使用最廣泛的(投擲在隱藏層或兩個通常也有幫助)。我聽說過的另一種技術是Wisard(或Wizard),但我找不到任何有關它的信息。這種技術基本上是將圖像分成多個部分,然後在將圖像片段與知識庫中的圖像片段進行比較時獲得相似比例。這就是說,如果我在哪裏我會堅持神經網絡加上一個體面的圖形操作庫,如OpenCV(有各種各樣的包裝,爲此,包括Java和C#)。目標是儘可能多地消除不必要的信息。例如,在某些情況下,將圖像縮小爲灰度或嚴格黑白像素有幫助。