2017-07-27 126 views
1

我目前正在開發一個項目,我需要創建一些用戶可以與產品交流的功能(Raspberry Pi 3)。在談話中,我的意思是說用戶應該能夠向Pi發出一兩個字,例如「產品開始」,然後它就會被激活並執行它。連續語音識別

現在正因爲如此,當用戶說出某個單詞組合時,Pi需要能夠不斷地收聽並激活。

我已經實現了SpeechRecognition庫,這樣的作品,但遺憾的是最多有10秒鐘的時間,Pi會收聽。

我想知道是否有任何圖書館可以幫助我與我的用例,任何幫助是值得歡迎的。

回答

1

你能更好地解釋你是什麼意思

可悲的最多到10秒,其中丕會聽的。

從我使用CMUSphinx的經驗(讓我推薦你的用例中的pocketsphinx版本),可以持續工作,沒有問題。 你有沒有設法知道問題是在Pi側,還是在SpeechRecognition方面?

你在SpeehRecognition後面使用了什麼引擎。 CMUSphinx,谷歌,微軟?有了Google和微軟,他們有10秒的限制是很正常的。但是,使用CMUSphinx這不應該發生。但是,您可能需要了解如何設置ASR系統。

+0

感謝您的回覆。大約10秒鐘之後,從執行Python腳本的那一刻起,我的Raspberry Pi將會監聽大約10秒。現在這不是Pi本身的問題,這是在SpeechRecognition方面,我發現10秒是它能夠識別的最大值。現在你提到了Pocketsphinx,我讀了一下它,但我並沒有不停地聽。你知道它是否能夠直接從麥克風識別嗎?或者它只能從WAV文件中識別出來。你也有任何好的Pocketsphinx教程嗎? –