這可能是很愚蠢的問題,但我無法在任何地方找到細節。如何使用MFCC向量來分類單個音頻文件?
所以,我有錄音(WAV文件)爲3秒。這是我的示例,它需要分類爲[class_A]或[class_B]。
通過以下對一些MFCC tutroial,我把樣本分成幀(291幀是精確的)和我已經得到從每幀的MFCC。
現在我有291個的特徵向量,每個向量的長度爲13
我的問題是;你到底如何用分類器(例如k-NN)來使用這些向量?我有291個向量代表1個樣本。我知道如何處理1個樣本的1個矢量,但如果我有291個樣本,我不知道該怎麼辦。我無法在任何地方找到解釋。
您可以提供鏈接到你是如何解決的呢? – 2018-01-18 21:05:31
請您發表您的解決方案 – 2018-01-18 23:53:45