我正在嘗試開發一個使用Matlab作爲我的項目的印地語語言字符識別系統。需要幫助提高模式識別神經網絡的準確性
我的數據集包含大約15000個單字符二進制字形圖像樣本。這些圖像每個都是30 * 30像素。例如附加圖片。該圖像(900個像素值)存儲在X中(使其成爲numOfSamples * 900大小的變量),並且Y是numOfSamples * numberOfClasses大小的矢量,其類別爲1,其餘爲0。
考察,看的鏤空文字圖像:postimg.org/image/lgxh2zq1f/
我使用以下網絡
net=patternnet([500,250,125,65]);
上述網絡的樣子,
訪問查看網絡:postimg.org/image/666qear15/
我訓練網絡後,
[net,tr]=train(net,X,Y);
我的ROC繪圖和性能情節看起來像以下,
訪問,查看ROC曲線:https://postimg.org/image/etb5woper/
訪問,查看性能情節:https://postimg.org/image/aij4rmsfd/
現在,在ROC圖中,在0.7左右曲線即使在訓練圖中也會彎曲。我無法理解爲什麼!
我無法獲得所需的準確度。目前的準確率在70%左右,預計在90 +%左右。
我還嘗試過其他模型,如SVM,KNN,Ensemble都給了我大約相同的70%結果。
我對機器學習相當陌生,不勝感激。
謝謝
PS:對不起,不好的鏈接!我是一個新用戶,所以不能發佈超過2個鏈接