voice-recognition

    1熱度

    2回答

    所以我試圖開發一種使用語音識別處理很多的事件就像調用任何一個電話號碼的應用程序,打開其他應用程序,切換設置等 我所做的到現在正在實施的呼叫特性,我在哪裏卡住的地方是如何打開另一個應用程序 我的代碼到目前爲止是: private void promptSpeechInput() { Intent intent = new Intent(RecognizerIntent.ACTION_REC

    0熱度

    1回答

    我正在用西班牙語用cmusphinx。我下載了西班牙語模型和字典,但準確性很差... 我試圖從「es.dict」中刪除所有單詞,少了我需要的單詞。準確度更改爲100%(刪除99%的文字...)。 但是,這種變化產生了另一個問題的性能,我認爲系統試圖讀取文件「es-20k.lm」中的每個單詞。 我的輸出顯示此爲每個已刪除的字: 「2016年11月12日下午11時05分14秒edu.cmu.sphin

    1熱度

    1回答

    這是我打電話驗證功能: def verify(verificationProfileId, pathToVoicePrint) soundFile = File.read(pathToVoicePrint) uri = URI("https://api.projectoxford.ai/spid/v1.0/verify?verificationProfileId=#{ve

    0熱度

    1回答

    我嘗試了CMU Sphinx的Android演示。它進行得很順利,但當別人說「哦,可能是電腦」時,它也會觸發。 因此,我想製作像Ok Google這樣的東西,只有當我說出像Ok Google這樣的「Oh mighty Computer」纔會激活? 有沒有辦法在CMU Sphinx上做到這一點?

    2熱度

    2回答

    我使用語音識別並檢查一個顏色列表,如果我所說的不在列表中,那麼它會顯示'顏色未找到',如果發現它顯示'顏色發現'我只希望它顯示每條消息一次。 我遇到的問題是如何讓'顏色未找到'味精正確顯示。 # speech recognition import speech_recognition as speech #a lot of variables used for loops and cond

    1熱度

    1回答

    我試圖在我的應用程序中實現基於語音的數據渲染,當用戶說話(詢問他尋找的數據的一些問題),即語音識別過程正在發生,想要顯示一些屏幕上的波動類動畫。 我沒有得到確切的想法我如何實現它,我已經經歷了一些與這些動畫相關的問題,如Circle voice animation in Android,但沒有成功。 有人請幫助我,我該如何做到這一點。

    1熱度

    1回答

    我正在嘗試使用PocketSphinx的關鍵字檢測來獲取在Python中運行的語音識別引擎。我通過pip安裝了它,並在另一個問題的答案中找到了一些關鍵字檢測代碼。我使用的代碼如下: http://pastebin.com/Qd7i19jM 出於某種原因,我不斷收到這個錯誤,沒有任何人知道爲什麼嗎? ERROR: "acmod.c", line 83: Folder '/usr/local/shar

    0熱度

    1回答

    目前,我正在開發iOS應用程序,該語言命令時觸發事件。 我看到一個相機應用程序,用戶說「開始錄製」,然後相機開始錄製模式。 這是一款應用內語音控制功能,所以我認爲它與我已經實施的SiriKit或SpeechRecognizer不同。 我該如何實現它? 我的問題不是語音聽寫,用戶必須按一個按鈕開始聽寫。 應用程序需要被動等待關鍵字或意圖,這就像「myApp,開始錄製」或「myApp,停止錄製」,然後

    0熱度

    1回答

    基本上我想打開我的應用程序,當在一定的環境(俱樂部場景),可以在iOS中使用算法打開應用程序? 問候, Feras A.

    1熱度

    1回答

    我有一個概念問題。 我知道什麼是MFCC。但是我無法找到用於說話者識別和語音識別的mfcc特徵向量之間的區別,即哪個部分的mfcc特徵被用作兩個之間的區分因子? 而且我們如何在mfcc矢量的基礎上區分兩個揚聲器?