機器學習中的照片OCR算法

我最近在coursera上開設了機器學習課程，並通過了體面分數的課程。我在課程中使用了KNN，Logistic迴歸，NN等算法，其中一項任務是編寫能夠完成的數字識別學習算法。課程最後以Photo OCR的案例研究結束，這讓我非常興奮，但是我發現很難將課程中教授的基本算法應用於這個巨大的問題。所以任何人都可以在Photo OCR上提供一些算法嗎？機器學習中的照片OCR算法

來源

2012-08-31 Dude

圖像識別的問題在於它對任何變化都非常敏感。他們的平均人類大腦能夠從圖像中提取某些特徵，即使某些圖像操作（如傾斜，旋轉等）已被應用，也可以讓我們識別給定的圖像。

這就是說，據我所知，人工神經Netwoks是使用最廣泛的（投擲在隱藏層或兩個通常也有幫助）。我聽說過的另一種技術是Wisard（或Wizard），但我找不到任何有關它的信息。這種技術基本上是將圖像分成多個部分，然後在將圖像片段與知識庫中的圖像片段進行比較時獲得相似比例。這就是說，如果我在哪裏我會堅持神經網絡加上一個體面的圖形操作庫，如OpenCV（有各種各樣的包裝，爲此，包括Java和C＃）。目標是儘可能多地消除不必要的信息。例如，在某些情況下，將圖像縮小爲灰度或嚴格黑白像素有幫助。

來源

2012-08-31 09:23:08 npinti

機器學習中的照片OCR算法

回答

相關問題