我想確保我使用的是正確的術語。下面的圖顯示了MNIST例如這個神經網絡中有多少層?
X is 784 row vector
W is 784X10 matrix
b is a 10 row vector
The out of the linear box is fead into softmax
The output of softmax is fed into the distance function cross-entropy
多少層都在這個NN?那個例子中的input
和hidden
層是什麼?
同樣,有多少層在this answer如果我的理解是正確的,那麼3
層?
編輯
@lejlot是否低於表示3層狀NN與1隱藏層?
你在混淆符號。輸入層是放置輸入數據的向量x。然後操作 - > * w - > + b - > f() - >是第一層和第二層之間的並存。第二層是存儲結果z = f(x * w1 + b1)的向量,則softmax(z * w2 + b2)是第二層和第三層之間的並集。第三層是存儲最終結果y = softmax(z * w2 + b2)的向量y。交叉熵不是一個層次是培養你的神經網絡的成本函數。 – Rob