0
我想開發一個應用程序,在給定幾張撲克牌的圖像的情況下,能夠分辨這些卡上的數字。我從來沒有做過任何圖像處理,所以我想知道我該如何開始。任何想法將不勝感激!從撲克牌中提取數字
我想開發一個應用程序,在給定幾張撲克牌的圖像的情況下,能夠分辨這些卡上的數字。我從來沒有做過任何圖像處理,所以我想知道我該如何開始。任何想法將不勝感激!從撲克牌中提取數字
很大程度上取決於圖像的樣子。例如,如果圖像是從移動攝像頭拍攝的,並且必須先進行預處理,然後才能進行OCR。
我以前使用過Tesseract(https://code.google.com/p/tesseract-ocr/)來做OCR,它對於打印的文本可以正常工作。但是如果沒有對手機圖像進行培訓,效果會很差。如果你不想自己完成所有的工作,你也可以使用一些第三方付費API。
我也得到了一些有價值的建議是到
圖像確實是從移動設備拍攝的。凸輪應該在5百萬像素左右。無論如何,你能指定「預處理」的含義嗎?非常感謝! –
我提到的步驟1和2是兩個預處理步驟,可以幫助進行圖像識別。 – smk
我可能會遺漏一些東西,但OCR是用來識別文本的技術,對吧?那麼在做OCR之前,我會如何「只保留圖像中的文本部分」? –