我正在嘗試使用像CNN這樣的深度學習技術來檢測和讀取車牌號碼的深度學習模型。我將在張量流中建立一個模型。但我仍然不知道構建這種模型的最佳方法是什麼。構建識別車牌模型的最佳方法(ALPR)
我檢查了幾個模型這樣 https://matthewearl.github.io/2016/05/06/cnn-anpr/
我也查了一些研究論文,但沒有顯示具體的方式。
所以我就準備要遵循的步驟是
圖像使用OpenCV的預處理(灰度,轉換等我不知道很多關於這部分)
車牌檢測(可能是通過滑動窗口方法)
- 使用CNN通過構建合成數據集來訓練,如上面的鏈接。
我的問題
有沒有什麼更好的方法來做到這一點?
RNN也可以結合CNN後的可變長度數字嗎?
我應該更喜歡檢測和識別個別字符,而不是整個板塊?
有許多老方法喜歡圖像預處理和直接傳遞到OCR.What會是最好的?
PS-我想製作一個商業實時系統。所以我需要很好的準確性。
如果您希望CNN能夠在真實的光照,移動,角度和故意混淆的情況下閱讀真實生活中的車牌,那麼您將需要大量的示例圖像數據集。綜合數據只會讓你到目前爲止。就像凱西李建議的那樣,建立一系列約束步驟可能是你最好的選擇,但是你的系統只能和最薄弱的環節一樣強大。如果您的牌照檢測只有97%,那麼97%是您的準確度上限。如果您的CNN每個字符的準確率爲99%,並且有8個字符,那麼您的上限精度爲.99^8 = 92%。 – Wontonimo
是的,我明白了。我需要一種方法來確保我只是從號碼牌中讀取,忽略圖像中的其他文本,如招牌或其他東西 –