2017-02-15 43 views

回答

0

1)您採用現有的DNN模型或自行訓練。你可以使用Kaldi的Tedlium實驗,它可以自由運行。模型是否適用於英語並不重要,它也適用於其他語言。

2)您從兩個訓練關鍵詞中提取DNN後綴。可以使用nnet3-am-compute工具。它需要DNN模型並返回每個幀的語音或狀態後驗。

3)您執行DTW algorithm來比較DNN後綴。這部分你必須自己做,它不是在Kaldi中實現的。

相關論文描述的算法:

Investigating Neural Network based Query-by-Example Keyword Spotting Approach for Personalized Wake-up Word Detection in Mandarin Chinese

Query-By-Example Spoken Term Detection Using Phonetic Posteriorgram Templates