我很好奇我如何能夠更可靠地識別價值和撲克牌圖像的套裝。這裏有兩個例子:tesseract可以訓練非字體符號嗎?
有可能是在圖像的一些噪音,但我有一個大的數據集,我可以使用訓練圖像的(大約10K的PNG文件,包括所有值&套) 。
如果我使用哈希方法進行已知精確匹配,我可以可靠地識別手動分類的圖像。但是由於我基於內容對圖像進行散列處理,因此最輕微的噪聲會改變散列並導致圖像被視爲未知。這正是我期望通過進一步自動化可靠解決的問題。
我一直在檢討培訓正方體3.05文檔: https://github.com/tesseract-ocr/tesseract/wiki/Training-Tesseract#automated-method
可以正方體只用字體中的圖像進行培訓?還是我可以用它來識別這些卡片的套裝?
我希望我可以說這個文件夾中的所有圖像都對應於4c(例如上面的示例圖像),並且tesseract會在該圖像的任何未來實例中看到相似性(無論噪聲如何),並且還會讀取作爲4c。這可能嗎?有人在這裏有經驗嗎?