2013-11-20 76 views
0

我剛剛開始探索用於檢測wav文件中鼓瞬變的神經網絡。我想通過創建一個具有相同輸入數量,隱藏節點和輸出的神經網絡來實現這一點,爲每個輸入提供一個音頻樣本,並且如果在該樣本處可能出現鼓瞬變,則訓練相應的輸出爲高,並且低,如果不是。我想這樣做,因爲我不能確定在餵養它的數據中會出現多少單獨的瞬變,它可能是一個,很多或沒有。如果有的話,我需要它輸出瞬態的樣本位置。這種方法會起作用嗎?有一個更好的方法嗎?用於檢測音頻中多個特徵的神經網絡

回答

0

我做了一些與視覺數據中檢測模式相似的東西。不完全一樣,但我會告訴大家,成功培訓網絡所花費的時間遠遠超過了編寫其他選項所需的時間。我希望你能找到同樣的結果:訓練到結果的一致性可能會非常耗時,並且會受到神經網絡的影響。

如果這是一個學術或休閒活動(即看看是否可以完成),那麼我認爲你最終會得到它。如果你只是想要結果,我想你可能會有更好的運氣,用更直接的方法表徵一個瞬態並使用(可能)諸如模糊推理來評分候選信號。

我認爲有可能重疊瞬態?這肯定會讓網絡訓練變得更加困難,但是我再次想象這會使任何方法更具挑戰性。

我不是這方面的專家;我只提供我嘗試訓練神經網絡的低信號/噪聲數據的經驗,這是一種痛苦。

+0

感謝您的回覆。準確訓練需要多長時間?它到底有多精確?我還有另外一個漂亮的香草算法,它目前正在做這項工作,我只是想用神經網絡來讓它更準確。如果我能夠顯着提高準確性,我不認爲需要數週才能進行訓練。 –

+0

花費了大約3周的試驗和錯誤才能使其工作得相當好。目標是根據從任意角度拍攝的照片來訓練網絡以正確識別不同類型的汽水罐。最後,當輸入受到足夠的限制(大部分標識必須可見,並且攝像機角度不能太直接)時,準確度大約爲90%。我會說我從來沒有真正滿意,但這是一個有趣的嘗試。 這聽起來像是你正處在正確的思維框架中,尤其是在已經有效的替代方法的情況下。 – MikeD

+0

您的數據的性質很可能會帶來更好更快的結果。 – MikeD