6
A
回答
3
CMUSphinx實現了pocketsphinx引擎關鍵詞識別,詳見FAQ entry.
要識別單一的關鍵詞,你可以在「搜索的關鍵詞」模式運行的解碼器。
從命令行嘗試:
pocketsphinx_continuous -infile file.wav -keyphrase 「oh mighty computer」 -kws_threshold 1e-20
從代碼:
ps_set_keyphrase(ps, "keyphrase_search", "oh mighty computer");
ps_set_search(ps, "keyphrase_search);
ps_start_utt();
/* process data */
您也可以在我們的消息來源爲Python和Android/Java的例子。 Python代碼看起來是這樣的,完整的例子here:
# Process audio chunk by chunk. On keyphrase detected perform action and restart search
decoder = Decoder(config)
decoder.start_utt()
while True:
buf = stream.read(1024)
if buf:
decoder.process_raw(buf, False, False)
else:
break
if decoder.hyp() != None:
print ([(seg.word, seg.prob, seg.start_frame, seg.end_frame) for seg in decoder.seg()])
print ("Detected keyphrase, restarting search")
decoder.end_utt()
decoder.start_utt()
門檻必須調整對測試數據的每個關鍵詞短語,以獲得正確的平衡漏檢和誤報。你可以嘗試像1e-5到1e-50這樣的值。
爲了獲得最佳準確度,最好使用帶3-4個音節的關鍵詞。太短的詞組很容易混淆。
您還可以搜索多個關鍵詞的,創建一個文件keyphrase.list這樣的:
oh mighty computer /1e-40/
hello world /1e-30/
other_phrase /other_phrase_threshold/
而且在解碼器-kws配置選項一起使用。
pocketsphinx_continuous -inmic yes -kws keyphrase_list
此功能尚未在sphinx4解碼器中實現。
相關問題
- 1. 演講到文字轉換。?
- 2. 演講PDF?
- 3. JavaScript中的演講(TTS)
- 4. WinRT上的演講
- 5. Android(RecognitionListener)現場演講文本預覽
- 6. Silverlight和演講sdk
- 7. 演講android系統
- 8. 與Java的演講比較
- 9. 保持演講的Android
- 10. 演講到Android中的文本API
- 11. 演講到分機轉換
- 12. 只有演講第一次
- 13. 當演講結束後
- 14. WordNet - 部分演講要求?
- 15. C#發現使用var關鍵字
- 16. R:發現包含某個關鍵字
- 17. 使用VBA的Microsoft Excel演講 - 講多個項目?
- 18. Wpf usercontrol的按鈕沒有觸發演講者的ICommand
- 19. Webkit的演講 - 的Javascript觸發話筒聽
- 20. 從演示文稿中刪除演講者備註編程
- 21. 偉大的計算機科學演講
- 22. 上演節目 - 傑克Bolewski的講話
- 23. 演講到模擬器上的文本
- 24. 文本到流星的演講?
- 25. PocketSphinx在Android中的自己的關鍵字發現
- 26. 發現關鍵除了
- 27. 在sql中發現相似的關鍵字
- 28. 阿拉伯文字在iphone上的演講
- 29. 我如何用女性的聲音做文字演講?
- 30. 如何發展技能說話/寫/做技術專題演講
是否有算法說明或庫在不使用CMUSphinx的情況下在音頻流上進行關鍵字識別? –
當然,你可以谷歌的「關鍵字spotting」 –
是很多研究論文,但沒有死簡單的實施 –