2015-07-01 43 views
0

到目前爲止,我的第一個障礙是在MTG卡的圖像上運行tesseract香草不會識別卡片標題(說實話這就是我需要的,因爲我可以使用該文本來拉出卡片信息的其餘部分從數據庫)我認爲這個問題可能是需要訓練tesseract認識字體在mtg卡的使用,但我想知道是否它可能是一個問題tesseract不尋找或不檢測圖像中的文本(特別是標題)。在MTG卡上使用tesseract

編輯:包括MTG卡的圖像作爲參考。 http://gatherer.wizards.com/Handlers/Image.ashx?multiverseid=175263&type=card

+0

發佈圖像樣本 – Photon

+1

什麼是MTG卡?他們看起來如何?他們有什麼高質量的圖像?你使用什麼操作系統? –

+0

這裏是一個MTG卡的圖像示例http://gatherer.wizards.com/Handlers/Image.ashx?multiverseid = 175263&type = card 我已經使用了從600px到1080px的各種不同的分辨率。這是運行Raspbian OS – Greyjedi

回答

0

好了,所以,要在Reddit上編程論壇後,我想我找到了答案,我要去追求:

正方體的訓練特徵的確是提高了不尋常的字體率,但是這可能不是你成功率低的原因。 文本所處的環境控制得不好 - 卡片背景可以是五種顏色之一的紋理加上文物和土地。 Tesseract在處理之前會對圖像產生灰度,因此文本與背景之間的對比度不足。 你可以把你的卡片通過一個預處理器,它將彩色區域靜音爲白色並增強單調性。這應該會增加對比度,所以tesseract可以確定角色。

如果還有人認爲上面的路徑是錯誤的,請說出來。