2013-07-18 100 views
0

我嘗試編寫一個可以測試用戶發音的程序。如何使用.net比較兩個音軌的波形?

這一計劃將打出一波聲音,說英語句子,並且用戶將嘗試發音是和記錄他的話,程序會檢查波形的相似性,並給點到用戶的發音。

問題是,是否有可能使用.net編寫此程序?如果是,我可以使用哪些庫?任何指南開始?

回答

1

音樂識別程序通常代表音域中的聲音(如捕捉音高)。

從某些光譜表示中,可以使用距離度量(歐幾里得或其他)。

對於語音,時間維度是必要的。

空域中,翹曲是佔時的變形(慢VS快)的措施似乎是一個不錯的選擇爲好。

模板匹配算法可能是不錯的候選者,以及像OCR算法,但現在你會處理聲波。

聲波算法的通常考慮是滑動窗口或分割。