連續語音識別

我目前正在開發一個項目，我需要創建一些用戶可以與產品交流的功能（Raspberry Pi 3）。在談話中，我的意思是說用戶應該能夠向Pi發出一兩個字，例如「產品開始」，然後它就會被激活並執行它。連續語音識別

現在正因爲如此，當用戶說出某個單詞組合時，Pi需要能夠不斷地收聽並激活。

我已經實現了SpeechRecognition庫，這樣的作品，但遺憾的是最多有10秒鐘的時間，Pi會收聽。

我想知道是否有任何圖書館可以幫助我與我的用例，任何幫助是值得歡迎的。

來源

2017-07-27 Koen de Haan

你能更好地解釋你是什麼意思

可悲的最多到10秒，其中丕會聽的。

從我使用CMUSphinx的經驗（讓我推薦你的用例中的pocketsphinx版本），可以持續工作，沒有問題。你有沒有設法知道問題是在Pi側，還是在SpeechRecognition方面？

你在SpeehRecognition後面使用了什麼引擎。 CMUSphinx，谷歌，微軟？有了Google和微軟，他們有10秒的限制是很正常的。但是，使用CMUSphinx這不應該發生。但是，您可能需要了解如何設置ASR系統。

來源

2017-07-27 21:46:07

感謝您的回覆。大約10秒鐘之後，從執行Python腳本的那一刻起，我的Raspberry Pi將會監聽大約10秒。現在這不是Pi本身的問題，這是在SpeechRecognition方面，我發現10秒是它能夠識別的最大值。現在你提到了Pocketsphinx，我讀了一下它，但我並沒有不停地聽。你知道它是否能夠直接從麥克風識別嗎？或者它只能從WAV文件中識別出來。你也有任何好的Pocketsphinx教程嗎？ –

連續語音識別

回答

相關問題