YouTube語音識別 - 包含特殊字詞的音頻？

我在想一個機制來找出一個特殊的詞，例如「你好世界」在YouTube視頻中說。我真的不知道如何做到這一點，但我的做法是：來自YouTube的視頻通過YouTube-DLYouTube語音識別 - 包含特殊字詞的音頻？

但這是非常不可靠的。 pocketsphinx_continuous不太適合。

任何人都可以提出一個很好的解決方案嗎？

Thx爲您的幫助！

2014-04-29 elchueko

最近pocketsphinx有特殊的關鍵字spotting模式來查找關鍵字（pocketsphinx_kws -infile file.wav）。至於可靠性，您可能沒有將音頻轉換爲適當的格式，或者存在其他問題。 –

而且，pocketsphinx搜索關鍵字比任何解碼都更有效率。 –

我沒有找到解釋「pocketsphinx_kws」的任何網站。只有3頁從谷歌返回？你能解釋我將如何使用它嗎？ WAV文件有我認爲適當的格式：mono，16KHz，16bit 對不對？ – elchueko

pocketsphinx_continuous本身有kws內置。您可以使用pocketsphinx_continuous -hmm en-us -infile file.wav -dict dictfile.dict -kws "keyphrase"

2014-08-11 06:51:42 Meehatpa

回答