我目前正在開發語音識別項目,並試圖選擇最有意義的功能。 大部分相關論文都建議使用零交叉率,F0和MFCC功能,因此我正在使用這些功能。 我的問題是,持續時間爲00:03的訓練樣本有268個特徵。考慮到我正在做一個多類分類項目,每個類訓練包含50+個樣本,包括所有MFCC特徵可能會受到維度詛咒或「降低其他特徵的重要性」項目的影響。 所以我的問題是,我應該包括所有MFCC功能,如果不是,你可以建議一個替代方案嗎?語音識別所需的MFCC功能
1
A
回答
2
您不應該使用f0和過零點,它們太不穩定。您可以簡單地增加訓練數據並使用mcccs,它們具有良好的表示能力。但記住要將它們標準化。
2
得到各幀的MFCC係數之後,可以表示如MFCC特徵的組合:增量MFCC特徵的concent在此 link.
39尺寸被描述
1) First 12 MFCC 2) 1 energy feature 3) 12 delta MFCC feature 4) 12 double-delta MFCC feature 5) 1 delta energy feature 6) 1 double delta energy feature
MFCC功能饋入HMM或 Recurrent Neural Network。
1
我想說的是MFCC不是必需的。您可以使用MFCC,並且您可以使用@Mahendra Thapa提及的能量,增量和delta-delta功能,但它不是「必需的」。一些研究人員使用40個CC,一些人從MFCC計算中刪除DCT,使其成爲MFSC(譜不倒譜)。一些添加額外的功能。一些使用較少。對維度詛咒的易感性取決於你的分類器,不是嗎?最近一些人甚至宣稱已經在語音識別的「聖盃」方面取得了進展,通過深度學習來訓練原始信號的使用,學習最佳特徵而不是手工製作它們。
0
MFCC被廣泛使用,效果相對更好。
+0
可否請您擴展您的答案 –
相關問題
- 1. 使用HMM或MFCC語音識別
- 2. 用於說話人識別和語音識別的MFCC功能之間的區別?
- 3. Android中的語音識別功能
- 4. android中的語音識別功能
- 5. Android中的語音識別功能
- 6. 如何獲得語音識別功能
- 7. MATLAB mfcc gmdistribution適合語音識別程序
- 8. 語音識別/識別
- 9. 語音/語音識別 - PhoneGap
- 10. 語音識別
- 11. 語音識別
- 12. 如何使用mfcc功能來訓練用於語音識別的svm分類器?
- 13. Java中的Swing Framework具有人臉識別和語音識別功能
- 14. dll通過kinect語音識別所需的C++項目
- 15. Java語音識別
- 16. 語音識別,nodeJS
- 17. PHP語音識別?
- 18. 語音識別vb6
- 19. Android語音識別?
- 20. android語音識別
- 21. 語音識別API
- 22. 語音識別API
- 23. JavaScript語音識別
- 24. C#語音識別
- 25. Android - 語音識別
- 26. Android:語音識別
- 27. C#語音識別
- 28. 語音識別和錄音
- 29. 語音識別(或聲音)
- 30. 西班牙語語音(語音)識別
mfcc僅適用於語音還是可以用於任何音頻/聲音相關的任務? –
對於某些任務MFCC可以,對於音樂識別等一些任務來說,沒有足夠的分辨率和其他功能。 –