2014-05-01 46 views
0

我讀了一些書,但仍不能確定我應該如何組織網絡。例如,我有大小爲120 * 100的pgm圖像,輸入應該如何(像一個尺寸爲120 * 100的一維數組)?以及我應該調整多少個節點。如何選擇在人臉識別中使用BP網絡的節點數量?

+0

當談到節點數 - 沒有「正確」的節點數量使用。你的輸入應該是一維矩陣(矢量)。如果你能夠聚集圖像像素組,從而在不損失太多信息的情況下實現更小的圖像 - 這將加快學習過程。 – jorgenkg

+0

@jorgenkg謝謝! – litaoshen

回答

1

通常最好將輸入圖像組織爲2D矩陣。原因在於機器感知任務中使用的神經網絡較低層的層通常是局部連接的。例如,這種神經網絡的第一層的每個神經元將僅處理輸入圖像的小NxN片的像素。這自然導致2D結構,其可以用2D矩陣更容易地描述。

有關詳細的解釋,我將向您介紹DeepFace論文,其中描述了人臉識別系統中的藝術狀態。

1

120 * 100一維向量是罰款。該向量中的像素值的位置並不重要,因爲無論如何,所有節點都與下一層中的節點完全連接。但是你必須在培訓,驗證和測試之間保持一致。

1

迄今爲止最成功的方法是使用帶有2D輸入的卷積神經網絡,就像@benoitsteiner所說的那樣。對於一個更簡單的例子,我會參考LeNet-5,一個爲MNIST手寫數字識別開發的小型神經網絡。它在EBLearn中用於人臉識別,效果相當不錯。