我是Tensorflow的新成員,我正在嘗試構建能夠在我的圖像上執行OCR的模型。我必須閱讀9個字符(固定在所有圖像中),數字和字母。我的模型將與此類似OCR的Tensorflow模型
https://matthewearl.github.io/2016/05/06/cnn-anpr/
我的問題是,我要培養我對每個人物模型首先和後組合的字符得到完整的標籤來表示。或者我應該直接在完整的標籤上訓練?
我知道我需要傳遞給模型,相應圖片的圖片+標籤,這些標籤的格式是什麼,它是文本文件,我對這部分有點困惑,所以任何關於標籤格式的解釋傳遞給模型會有幫助嗎?我很感激,謝謝。
我建議對所有標籤組合進行培訓。這是最乾淨的解決方案。如果失敗了,那麼你可以嘗試不同的方法。您通常會傳入一個單獨編碼的向量作爲標籤。例如,對於狗和貓,你可以將標籤貓表示爲'[1,0]',將狗標記爲'[0,1]'。 – niczky12
好的,謝謝,我怎麼能通過例如標籤「17C31T2F」? –
尺寸爲32px x 32px的手寫符號的[HASYv2數據集](https://arxiv.org/abs/1701.08380)可能會對您有所幫助。 –