2016-12-08 49 views
1

我想用不同的聲音訓練我的神經網絡。但是,每個聲音的大小都不相同。有誰知道如何訓練具有不同大小輸入的神經網絡?謝謝。如何訓練具有不同大小輸入的神經網絡?

+0

你是什麼意思「每個聲音都不同」? 如果我理解正確,你有一個聲音的輸入,即樣本數組,你希望它是神經網絡的輸入。一種可能的解決方案是提取聲音的特徵(或其中的一部分),這將是值的常量向量。例如,如果你想提取語音識別的特徵,你可以使用類似MFCC的東西:https://en.wikipedia.org/wiki/Mel-frequency_cepstrum –

+0

每個聲音的長度是不同的,這意味着輸入矢量的大小每個標籤的聲音都會有所不同。例如,如果我想訓練識別聲音A,B,C的模型,但是,這三種類型的聲音的長度是不同的。如果我想用原始聲音訓練模型,而不是通過首先提取特徵來訓練模型? – Pelican

+0

我想你可能有興趣檢查一下:http://stats.stackexchange.com/questions/127542/convolutional-neural-network-for-time-series – HRgiger

回答

1

沒有辦法對不同大小的輸入進行分類,但可以將信號轉換爲一系列固定大小的特徵向量(或固定大小的原始聲音序列)。 對於一個聲音,我們通常使用MFCC或只是一個譜圖。因此,您需要應用對序列進行操作的方法。它可以是一個循環的神經網絡,或者你可以使用一個前饋網絡,然後以某種方式爲每個幀後處理它的輸出。