我嘗試編寫一個可以測試用戶發音的程序。如何使用.net比較兩個音軌的波形?
這一計劃將打出一波聲音,說英語句子,並且用戶將嘗試發音是和記錄他的話,程序會檢查波形的相似性,並給點到用戶的發音。
問題是,是否有可能使用.net編寫此程序?如果是,我可以使用哪些庫?任何指南開始?
我嘗試編寫一個可以測試用戶發音的程序。如何使用.net比較兩個音軌的波形?
這一計劃將打出一波聲音,說英語句子,並且用戶將嘗試發音是和記錄他的話,程序會檢查波形的相似性,並給點到用戶的發音。
問題是,是否有可能使用.net編寫此程序?如果是,我可以使用哪些庫?任何指南開始?
mesut!
假設您正在使用C#.NET,我可能會爲您提供一個答案。一個簡單的谷歌搜索引導我到這個YouTube視頻,它告訴你如何「繪製音頻波形」:http://www.youtube.com/watch?v=ZnFoVuOVrUQ
祝你好運,其餘的是由你決定!
音樂識別程序通常代表音域中的聲音(如捕捉音高)。
從某些光譜表示中,可以使用距離度量(歐幾里得或其他)。
對於語音,時間維度是必要的。
空域中,翹曲是佔時的變形(慢VS快)的措施似乎是一個不錯的選擇爲好。
模板匹配算法可能是不錯的候選者,以及像OCR算法,但現在你會處理聲波。
聲波算法的通常考慮是滑動窗口或分割。