感知器可以用來檢測手寫數字嗎？

假設我有一個小的位圖，其中包含一個數字（0..9）在手寫。感知器可以用來檢測手寫數字嗎？

是否有可能發現使用（兩層）感知的數字嗎？

除了使用神經網絡外，還有其他的可能性來檢測位圖中的單個數字嗎？

飼養位圖的每個像素直接到神經網絡需要大量的訓練，並不會用於處理圖像的縮放或旋轉工作。

爲了幫助神經網絡進行很好的分類，你需要執行一些預處理步驟。

規範化圖像：
- 調整對比度和亮度，以使圖像的直方圖的基準圖像相匹配。
- 模糊圖像，消除噪音。
- 使用某個閾值將其轉換爲黑色&白色。
- 找到形狀的邊界框，縮放到預定義的大小。
計算，可用於從另一個區分一個數字圖像的不同特徵：
- 的圖像—的Euler number告訴你有多少「洞」中有形狀（例如兩個孔對於數字8）。
- 白色像素（數字面積）
- 設定白色像素—的座標的principal components的數字告訴你如何「長」的形狀。
- ...其他功能，你可以想到，類似的數字往往有相似的值。

主要組分也可以用於標準化形狀的轉動，使最長軸是垂直的。

這些功能是您輸入神經網絡進行分類的內容，而不是像素。

2009-02-16 11:27:30 flodin

其實我已經試圖用神經網絡來執行類似的任務，我發現（到目前爲止），它工作得更好，如果我給實際像素到網絡，而不是進行計算，並給網絡的計算。當然，我可能沒有選擇好的計算作爲輸入。但是到目前爲止，如果沒有它們，假設圖像正常化的程度足夠，它就會正常工作。 – Phil 2009-09-27 00:45:05

這裏是一個巨大的手寫數字數據庫的鏈接。頭版還有許多不同方法的相對性能數據，包括2層神經網絡。這應該給你一個良好的開端： MNIST digits database and performance

你可能也想看看Geoff Hinton's work on Restricted Boltzmann Machines他說，執行得相當好，並且對他的網站一個很好的說明講座（很有看頭）。

2009-02-16 11:02:38

下面是一個使用一個訓練的神經網絡，以檢測單個數字（圖像大小固定爲28 * 28）中的Matlab example program。

2009-02-16 11:03:05 schnaader

回答