回答

8

飼養位圖的每個像素直接到神經網絡需要大量的訓練,並不會用於處理圖像的縮放或旋轉工作。

爲了幫助神經網絡進行很好的分類,你需要執行一些預處理步驟。

  • 規範化圖像:
    • 調整對比度和亮度,以使圖像的直方圖的基準圖像相匹配。
    • 模糊圖像,消除噪音。
    • 使用某個閾值將其轉換爲黑色&白色。
    • 找到形狀的邊界框,縮放到預定義的大小。
  • 計算,可用於從另一個區分一個數字圖像的不同特徵:
    • 的圖像—的Euler number告訴你有多少「洞」中有形狀(例如兩個孔對於數字8)。
    • 白色像素(數字面積)
    • 設定白色像素—的座標的principal components的數字告訴你如何「長」的形狀。
    • ...其他功能,你可以想到,類似的數字往往有相似的值。

主要組分也可以用於標準化形狀的轉動,使最長軸是垂直的。

這些功能是您輸入神經網絡進行分類的內容,而不是像素。

+1

其實我已經試圖用神經網絡來執行類似的任務,我發現(到目前爲止),它工作得更好,如果我給實際像素到網絡,而不是進行計算,並給網絡的計算。當然,我可能沒有選擇好的計算作爲輸入。但是到目前爲止,如果沒有它們,假設圖像正常化的程度足夠,它就會正常工作。 – Phil 2009-09-27 00:45:05

相關問題