如何訓練具有不同大小輸入的神經網絡？

我想用不同的聲音訓練我的神經網絡。但是，每個聲音的大小都不相同。有誰知道如何訓練具有不同大小輸入的神經網絡？謝謝。如何訓練具有不同大小輸入的神經網絡？

2016-12-08 Pelican

你是什麼意思「每個聲音都不同」？如果我理解正確，你有一個聲音的輸入，即樣本數組，你希望它是神經網絡的輸入。一種可能的解決方案是提取聲音的特徵（或其中的一部分），這將是值的常量向量。例如，如果你想提取語音識別的特徵，你可以使用類似MFCC的東西：https：//en.wikipedia.org/wiki/Mel-frequency_cepstrum –

每個聲音的長度是不同的，這意味着輸入矢量的大小每個標籤的聲音都會有所不同。例如，如果我想訓練識別聲音A，B，C的模型，但是，這三種類型的聲音的長度是不同的。如果我想用原始聲音訓練模型，而不是通過首先提取特徵來訓練模型？ – Pelican

我想你可能有興趣檢查一下：http://stats.stackexchange.com/questions/127542/convolutional-neural-network-for-time-series – HRgiger

沒有辦法對不同大小的輸入進行分類，但可以將信號轉換爲一系列固定大小的特徵向量（或固定大小的原始聲音序列）。對於一個聲音，我們通常使用MFCC或只是一個譜圖。因此，您需要應用對序列進行操作的方法。它可以是一個循環的神經網絡，或者你可以使用一個前饋網絡，然後以某種方式爲每個幀後處理它的輸出。

來源

2016-12-09 09:14:18

如何訓練具有不同大小輸入的神經網絡？

回答

相關問題