2014-04-29 47 views
0

我在想一個機制來找出一個特殊的詞,例如「你好世界」在YouTube視頻中說。我真的不知道如何做到這一點,但我的做法是:來自YouTube的視頻通過YouTube-DLYouTube語音識別 - 包含特殊字詞的音頻?

  • 提取音頻通過pocketsphinx_continuous
  • 語音識別和TXT文件保存

但這是非常不可靠的。 pocketsphinx_continuous不太適合。

任何人都可以提出一個很好的解決方案嗎?

Thx爲您的幫助!

+0

最近pocketsphinx有特殊的關鍵字spotting模式來查找關鍵字(pocketsphinx_kws -infile file.wav)。至於可靠性,您可能沒有將音頻轉換爲適當的格式,或者存在其他問題。 –

+0

而且,pocketsphinx搜索關鍵字比任何解碼都更有效率。 –

+0

我沒有找到解釋「pocketsphinx_kws」的任何網站。只有3頁從谷歌返回? 你能解釋我將如何使用它嗎? WAV文件有我認爲適當的格式:mono,16KHz,16bit 對不對? – elchueko

回答

0

pocketsphinx_continuous本身有kws內置。 您可以使用pocketsphinx_continuous -hmm en-us -infile file.wav -dict dictfile.dict -kws "keyphrase"