2014-11-24 48 views
-1

我正在嘗試開發一種提取聲音等一些有用數據的語音/聲音識別程序。例如..基本頻率/ MFCC /質心等。 語音通常以20到30毫秒的幀進行分段,並且窗口分析是 移位10毫秒。max/msp/jitter聲音 - 語音分割/識別/分析

我想找到一個補丁/對象或一些有用的建議,我怎樣才能實現一個窗口分割的框架,轉變,我喜歡的一個合理的分析 - 分割的步驟。

有沒有人知道一種方法來做到這一點?

回答