我指的是keras documentation來構建一個網絡,它以嵌入和一些其他重要特徵的形式獲取多個輸入。但是,如果我們已經定義了主要損失,我不明白輔助損失的確切影響。使用深度網絡的多輸入和多輸出模型中的輔助輸出的意義
在這裏,我們插入輔助損失,允許LSTM和嵌入層被平穩地訓練,即使模型中的主損失要高得多。
正如文檔中所提到的,我假設它有助於在嵌入/之前定義的任何其他圖層上平滑地進行訓練。我的問題是,如何確定輔助損失的權重。
我們編譯模型並給輔助損失分配一個0.2的權重。要爲每個不同的輸出指定不同的loss_weights或loss,可以使用列表或字典。
如果有人能夠解釋如何確定損失權重以及輔助損失權重的高/低值如何影響模型訓練和預測,我將非常感激。