2015-08-31 52 views
0

我正在嘗試使用openCV使用神經網絡來讀取阿拉伯數字的OCR應用程序。訓練神經網絡的最佳方法是什麼?

我的問題是什麼給了我最好的性能和速度?

  1. 輸入數字到NN在RGB形式
  2. 輸入數字的NN灰度形式
  3. 在二值化的形式
+0

我通過使用灰度數字來實現這一功能非常成功,因爲與RGB格式相比,它們提供的功能要少得多,而且功能可能不那麼重要。 – Alejandro

+0

當您嘗試使用RGB或Binarized形式實現它時,結果如何? –

回答

1

輸入數字的NN如果你想想看,顏色信息與識別數字完全無關。它也可能與速度無關,因爲它比NN更加預處理(取決於您的設置)。在性能方面,如果你已經實現了一個合適的模型,灰度和二進制之間應該沒有太大的區別。但是如果你很好奇,你可以通過對你的訓練數據進行二進制化並比較結果來很容易地進行測試。它可能取決於手頭的數據(例如,任何現有的噪音會被天真的二值化所放大)。