2
我想開發一個新的權重初始化方法,但我得到一個奇怪的訓練現象。你可以看到,輸出節點8是從來沒有的最大激活... 奇怪的神經網絡分類現象
我使用的是正切S型激活,MSE性能,並沒有偏向節點MATLAB patternnet。我試圖分類mnist數據庫的一個子集。
有沒有人有任何想法如何解決這個問題?儘管具有相同的體系結構,但使用nguyen-widrow初始化不會看到此結果。
編輯:
輸入:值768xN 0和1之間
目標:10xN值0或1每個相應行。所以它就像一個邏輯矩陣,每列有1個真實值。
一個或多個節點不激活,我展示了最好的情況。
這發生一個或多個層(1至5),更少或更多的培訓數據(1K到10k樣本。)
請顯示一些數據。你爲什麼消除偏見? - 這可能會非常負面地影響性能(取決於數據)。 – Stan
見編輯。我消除了偏見,因爲我的初始化方法沒有考慮偏見(現在)。沒有偏見地運行一個控件(通過將net.biasConnect更改爲零),與保持偏移層相比,顯示出沒有太大差異。 – Ian
8類是否在數據中具有一些細節? – Stan