的存在,我想創建Keras音頻分類系統,該系統簡單地確定一個給定的樣本是否含有人的聲音或沒有。沒有其他的。這將是我第一次嘗試機器學習。音頻分類與Keras:人聲
此音頻預處理器存在。它聲稱不會做,但它已經分叉了幾聲:
https://github.com/drscotthawley/audio-classifier-keras-cnn
我不明白這其中是如何工作的,但我已經準備好試一試:
https://github.com/keunwoochoi/kapre
但是,讓我們說,我得到了那些工作,將在過程的其餘部分是類似的圖像分類嗎?基本上,我從來沒有完全理解何時使用Softmax以及何時使用ReLu。如果我將數據映射爲張量,這與聲音會如何相似?
我還在開發一個應用程序來確定給定的樣本是否包含人聲(而不是任何其他可能的聲音)。你在凱拉斯取得了不錯的成績嗎? – felipeduque
@ eje211你可以分享你的進度代碼嗎?我正在處理類似的問題。如果我在狗皮上訓練模型,我想要模型來確定狗皮在測試文件中的位置。 –
我在之前的工作中這樣做過。我不再有權訪問代碼。抱歉。但是我的僱主對我的追求並不感興趣,所以我並沒有走得太遠。 – eje211