1
我目前正在開發一個項目,我需要創建一些用戶可以與產品交流的功能(Raspberry Pi 3)。在談話中,我的意思是說用戶應該能夠向Pi發出一兩個字,例如「產品開始」,然後它就會被激活並執行它。連續語音識別
現在正因爲如此,當用戶說出某個單詞組合時,Pi需要能夠不斷地收聽並激活。
我已經實現了SpeechRecognition庫,這樣的作品,但遺憾的是最多有10秒鐘的時間,Pi會收聽。
我想知道是否有任何圖書館可以幫助我與我的用例,任何幫助是值得歡迎的。
感謝您的回覆。大約10秒鐘之後,從執行Python腳本的那一刻起,我的Raspberry Pi將會監聽大約10秒。現在這不是Pi本身的問題,這是在SpeechRecognition方面,我發現10秒是它能夠識別的最大值。現在你提到了Pocketsphinx,我讀了一下它,但我並沒有不停地聽。你知道它是否能夠直接從麥克風識別嗎?或者它只能從WAV文件中識別出來。你也有任何好的Pocketsphinx教程嗎? –