我正在用神經網絡對字母和數字進行簡單識別。到目前爲止,我使用字母圖像的每個像素作爲網絡的輸入。毋庸置疑,這種方法會產生非常大的網絡。所以我想從我的圖像中提取特徵並將它們用作神經網絡的輸入。我的第一個問題是這些字母的屬性對於識別它們是有好處的。第二個問題是如何將這些特徵表示爲神經網絡的輸入。例如,我可能已經檢測到字母中的所有角並將它們作爲(x,y)點的矢量。如何將這個向量轉換成適合於NN的東西(因爲不同的字母的向量大小可能不同)。神經網絡特徵提取
Q
神經網絡特徵提取
7
A
回答
3
很多人已經採取了多種OCR功能。最簡單的是,直接傳遞像素值。
從UCI數據集中提取的OpenCV樣本中有一個字母識別數據。它採用了大約16種不同的功能。檢查這個SOF:How to create data fom image like "Letter Image Recognition Dataset" from UCI
你也可以在其中的一個答案中看到這篇文章解釋這個。你可以通過谷歌搜索。您可能還會喜歡this PPT。它給出了對現在使用的不同特徵提取技術的簡要解釋。
4
這篇文章Introduction to Artificial Intelligence. OCR using Artificial Neural Networks by Kluever (2008)給出了一個關於使用神經網絡的OCR的4種特徵提取技術的調查。他描述了以下方法:
- 運行長度編碼(RLE):您需要一個二進制圖像(即只有白色或黑色)。二進制字符串可以被編碼成更小的表示。
- 邊緣檢測:找到邊緣。由於這個原因,你可能會非常粗糙,所以不用返回精確的(x,y)座標,只需在減少的位置出現這樣的邊緣就可以減少矩陣(即,在20%,40%,60%,80%,80% %的圖像)。
- Count'True Pixels':這將圖像矩陣的
width * height
的維度降低到width + height
。您使用width
矢量和height
矢量作爲單獨的輸入。 - 基本矩陣輸入:您已經嘗試過;輸入整個矩陣會給出好的結果,但正如您注意到的那樣可能會導致高維度和訓練時間。您可以嘗試縮小圖像的大小(例如,從200x200到50x50)。
1
如果您有一個非常高維的輸入向量,那麼我建議您應用主成分分析(PCA)去除冗餘特徵並減少特徵向量的維數。
相關問題
- 1. 使用卷積神經網絡進行特徵提取?
- 2. 在特徵提取中實現卷積神經網絡
- 3. 缺失特徵的神經網絡
- 4. 卷積神經網絡 - 如何獲取特徵地圖?
- 5. 從卷積神經網絡(CNN)中提取特徵,並將此特徵用於其他分類算法
- 6. 具有相關特徵的神經網絡
- 7. 使用的詞語/特徵袋及神經網絡
- 8. 用於檢測音頻中多個特徵的神經網絡
- 9. 爲神經網絡(迴歸)重新標定輸入特徵
- 10. mfcc特徵大小如何影響recurent神經網絡
- 11. 具有6個特徵的人工神經網絡訓練
- 12. 神經網絡中「特徵」的定義是什麼?
- 13. 用於時間相關特徵的卷積神經網絡
- 14. 神經網絡
- 15. 神經網絡
- 16. 神經網絡[ocr]
- 17. 神經網絡,python
- 18. MATLAB神經網絡
- 19. 神經網絡backpropogation
- 20. 神經網絡:「InverseLayer」
- 21. 的神經網絡
- 22. SOM - 神經網絡
- 23. sigmoid神經網絡
- 24. Spiking神經網絡
- 25. H2O.deeplearning神經網絡
- 26. 神經網絡MNIST
- 27. Hopfield神經網絡
- 28. RBF神經網絡
- 29. 提高Tensorflow神經網絡 - 蟒蛇
- 30. 使用神經網絡提供建議