2013-08-26 51 views
0

我想開發一個應用程序,在給定幾張撲克牌的圖像的情況下,能夠分辨這些卡上的數字。我從來沒有做過任何圖像處理,所以我想知道我該如何開始。任何想法將不勝感激!從撲克牌中提取數字

回答

1

很大程度上取決於圖像的樣子。例如,如果圖像是從移動攝像頭拍攝的,並且必須先進行預處理,然後才能進行OCR。

我以前使用過Tesseract(https://code.google.com/p/tesseract-ocr/)來做OCR,它對於打印的文本可以正常工作。但是如果沒有對手機圖像進行培訓,效果會很差。如果你不想自己完成所有的工作,你也可以使用一些第三方付費API。

我也得到了一些有價值的建議是到

  1. 僅保留文本部分的形象。 (消除不必要的行/噪音)。
  2. 如果文本是垂直或以某個角度定位,請將文本 區域在水平方向上對齊。
+0

圖像確實是從移動設備拍攝的。凸輪應該在5百萬像素左右。無論如何,你能指定「預處理」的含義嗎?非常感謝! –

+0

我提到的步驟1和2是兩個預處理步驟,可以幫助進行圖像識別。 – smk

+0

我可能會遺漏一些東西,但OCR是用來識別文本的技術,對吧?那麼在做OCR之前,我會如何「只保留圖像中的文本部分」? –