2017-01-23 118 views
1

我目前正在嘗試實現一個cnn網絡,它可以將輸入映射到輸出。在keras中建立CNN網絡?

輸入由音頻文件構成,輸出是特徵向量。

由於音頻文件的長度不同,總採樣數總是不一樣,但每個採樣的幀長度爲25 ms,並且重疊了10 ms。形狀(x,2050)

輸出是一個特徵矢量形狀是(x,13)。

我以爲cnn的使用在這裏看起來很合適,因爲每個輸入都包含由於重疊而導致的前一個樣本的一些信息。

是否有可能在keras設計一個模型,利用這個,所以會計算一個矩陣的每一行的卷積和,並以某種方式使它知道25幀長度和10重疊。

回答

1

是的,請參見本文件的第220行[1]。這是使用卷積在Keras中實現的Wavenet。即使他們已經創建了包裝圖層,這應該能夠讓您直觀地瞭解如何對音頻樣本進行建模。

[1] https://github.com/basveeling/wavenet/blob/master/wavenet.py#L220

+1

感謝您的快速反應..我不知道,如果是屬於你的..但是你可以詳細闡述了實現一點? –