我的任務:我需要訓練卷積神經網絡來識別車號牌。訓練卷積神經網絡識別車號牌
輸入:圖像(像素陣列(我可以正常化它))
輸出:約號牌的位置信息。
問題:
1)哪種形式最好得到結果?例如:如果我想識別數字,我將使用10個元素的向量,其值將包含適當數字的概率。但我不知道在我的情況下使用哪種輸出形式。
2)哪種尺寸更適合用於輸入圖像?
3)這個問題與第一個有關。我如何構建我的訓練數據集?我的變體:位的掩碼,其中1表示這裏是一個號碼板的像素,以及JSON描述板的矩形(x,y,寬度,高度)。 我可以使用哪個程序進行映射?
我很抱歉,如果我的問題似乎對你太傻了:)
歡迎來到StackOverflow。請閱讀並遵守幫助文檔中的發佈準則。 [在主題](http://stackoverflow.com/help/on-topic)和[如何提問](http://stackoverflow.com/help/how-to-ask)適用於此處。 – Prune