0
我在想一個機制來找出一個特殊的詞,例如「你好世界」在YouTube視頻中說。我真的不知道如何做到這一點,但我的做法是:來自YouTube的視頻通過YouTube-DLYouTube語音識別 - 包含特殊字詞的音頻?
- 提取音頻通過pocketsphinx_continuous
- 語音識別和TXT文件保存
但這是非常不可靠的。 pocketsphinx_continuous不太適合。
任何人都可以提出一個很好的解決方案嗎?
Thx爲您的幫助!
最近pocketsphinx有特殊的關鍵字spotting模式來查找關鍵字(pocketsphinx_kws -infile file.wav)。至於可靠性,您可能沒有將音頻轉換爲適當的格式,或者存在其他問題。 –
而且,pocketsphinx搜索關鍵字比任何解碼都更有效率。 –
我沒有找到解釋「pocketsphinx_kws」的任何網站。只有3頁從谷歌返回? 你能解釋我將如何使用它嗎? WAV文件有我認爲適當的格式:mono,16KHz,16bit 對不對? – elchueko