我有一個形式爲N = W1 * Tanh(W2 * I)
的神經網絡,其中I是輸入矢量/矩陣。當我學習這些權重時,輸出具有某種形式。然而,當我添加一個標準化層時,例如,N' = Softmax(W1 * Tanh(W2 * I))
然而在N'單個元素的輸出向量中接近1而其餘幾乎爲零。這種情況不僅在SoftMax()中,而且在任何標準化層中。有沒有解決這個問題的標準方案?添加softmax顯着改變重量更新
-1
A
回答
0
這就是softmax function的行爲。也許你需要的是一個sigmoid函數。
+0
即使使用簡單的標準化,該問題仍然存在,如在yi = yi/yi的總和 – Rumu
+0
這是所需的行爲,也許您需要的是其他東西。你的預期結果是什麼? –
相關問題
- 1. 更新/添加localStorage與變量
- 2. PayPal IPN變量不添加和更新
- 3. 更改變量而不重新加載頁面
- 4. 更改不帶頁面重新加載的URL變量
- 5. ReactJS:重新加載組件,如果變量更改值
- 6. 會話變量更改時重新加載iframe內容
- 7. 更改變量onchange select無需重新加載頁面
- 8. 重新分配/更改全局變量時的變量範圍
- 9. 重新編碼,並添加前綴到變量變量
- 10. 重新切換/重新添加一個變量的類在jquery
- 11. 數量更改時更新總變量
- 12. 如果更改新行添加到數量添加聲明
- 13. 更新時傳遞的變量改變
- 14. 在更改Swift NSTextfield變量時更新
- 15. 更新變量作爲類更改
- 16. 更新變量值重新定義後
- 17. Apache重新加載無法更新環境變量?
- 18. C++更新/更改來自不同類/變量的變量
- 19. 更改全局變量onclick/img源更新與JavaScript變量
- 20. 更改變量的變量
- 21. 更改變量
- 22. PYTHON:更改整型變量的值而不重新創建變量
- 23. 添加變量名變量
- 24. 與其他變量JavaScript變量更新改變
- 25. .htaccess重定向,更改GET變量
- 26. JavaScript/JQuery變量需要更改..點擊。刪除舊號碼添加新號碼
- 27. 子表單不會隨着新添加的數據而更新
- 28. 如何添加固定變量名稱並更改變量名稱
- 29. 在Javascript中 - 如何更改圖像變量指向沒有重新加載它?
- 30. 使用滑塊更改變量並重新繪製Matplotlib圖
你是什麼意思的「某種形式」?你爲什麼稱它爲一個問題?這在分類歸一化中是完全正常的(並且期望的)行爲。什麼是確切的應用(有一個注意標籤,但沒有提到關注的問題) – lejlot
這是一個自我關注的編碼器 - 解碼器模型(如上面描述的N是一個自我注意模型) @lejlot由a某種形式,我的意思是輸出矢量具有一定的特性(這是所期望的),就像它增加到中間,然後交替減少和增加(例如0.1,0.3,0.5,1.5,0.5,1,0.3,1.2)。但是,添加一個Softmax圖層後,我得到了類似的東西 - (0.001,0.001,0,0.01,0.998,0.001,0,0,...)。 – Rumu
這僅僅意味着輸出'N'具有比其他值大得多的值。將「N」值添加到問題中。 – Maxim