2016-11-23 57 views

回答

4

目的是非線性行爲添加到網絡時,沒有它可以表示的官能團的數目是低的,如果你沒有非線性激活函數,網絡是完全線性的,這對於大多數問題並不是很有用。

每個添加非線性激活的圖層也會影響網絡輸出的非線性行爲。這是增加更多圖層可以提高準確性的一個原因,因爲網絡可以更好地表示不同的功能。

+0

我想添加[通用逼近定理](https://en.wikipedia.org/wiki/Universal_approximation_theorem),其中指出至少有一個(非線性)隱藏層(無限大小)的神經網絡可以近似任何功能。 – Lunaweaver

1

1.向網絡添加非線性表示。

2.請使用Relu,prelu,lrelu代替sigmoid,tanh,因爲減少了漸變梯度問題。