使用神經網絡進行數字識別的具體示例

我是一個非常非常（初學者）的人工神經網絡，並閱讀this tutorial。作者在下面的OCR示例中解釋了ANN。使用神經網絡進行數字識別的具體示例

有一個8x8網格與相等的單元格的二進制圖像（單元格總是相同的大小）。每個數字都是使用網格的一些單元格形成的。每張圖片都有數字0-9之一。

此外，假設所有訓練的數字也具有相等的8×8網格（例如訓練數字的向量4 =識別數字的向量4）。

例如，這是數字4的圖像：

所以他說，我們需要64個輸入（對每個網格單元一個輸入）。另外我們需要10個輸出節點（因爲我們有10個數字）。假設有一層隱藏節點。但我無法理解所有這些如何發揮作用。

誰能說出我們需要多少個隱藏節點以及這些隱藏節點必須做些什麼？

P.S.我們不需要在這裏完成所有幫助OCR處理 - 預處理，分割，演示。我們已經有向量的長度爲64的特徵。

2017-06-29 Pavel_K

我們可以有任意數量的隱藏神經元。權重是乘以輸入向量的矩陣，所以圖層的輸出可以是任意大小。在你的例子中，權重矩陣將具有以下大小。注意：我排除了非線性，例如sigmoid，tanh或relu，因爲它們按元素操作並且不改變形狀。

output = output_weights * hidden_weights * input 
10 x 1 10 x num_hid num_hid x 64  64 x 1

隱藏的神經元實際上做了什麼更微妙。在這個應用程序中，您試圖找到一個決策邊界，將「看起來像4的64像素圖像」與「看起來像3像素的64像素圖像」等空間分開。單層神經網絡（aka一個感知器）只能計算一個線性決策邊界。更深層次的神經網絡使得它可以更靈活地模擬更復雜的決策邊界。

爲了更好的直覺，嘗試玩Tensorflow web demo。您可以改變這些參數並查看添加更多圖層是如何增加更多表現力的，以及如何添加更多神經元來更改精度。

2017-06-30 18:07:10 user3080953

回答