speech-recognition

    0熱度

    1回答

    我正在使用android語音識別器,並在幾秒鐘後停止收聽?什麼是解決方案?在結束或錯誤

    0熱度

    1回答

    讀取其他Q & A是在計算器和CMUSphinx的官方網站上的信息,我讀到我必須調整閾值,但沒有人確切地說,閾值是多少。我明白,如果閾值的值越大,那麼你就有更大的機會得到有效的結果,但你可以放鬆一些,如果閾值越小,那麼你不會失去結果,但你會得到一些無效...(a在一些情況下它們很多)。我試圖進行關鍵字搜索,但找不到適用於我的關鍵字閾值的適當值。任何人都可以解釋這件事情是如何運作 具體的問題:當你犯

    0熱度

    1回答

    我使用Microsoft Bing Speech API來進行一些語音到文本任務。以下是我如何編碼, MicrophoneRecognitionClient micClient; micClient = SpeechRecognitionServiceFactory.CreateMicrophoneClient(SpeechRecognitionMode.LongDictation, "en-

    3熱度

    3回答

    我正在研究RPi3上Android Things的SDK的預覽版2。嘗試錄音機以及媒體錄音機,仍然無法獲取音頻捕獲。我正在試圖將我的演講轉換爲文字。不支持常規SpeechRecognition。我有USB MIC直接連接到RPi3以及通過USB聲卡連接到RPi3的耳機MIC。 MediaRecorder代碼: private void startRecording() { Log.d(T

    1熱度

    1回答

    在對語音框架進行了一些測試後,我意識到結果中沒有標點符號。有沒有辦法觸發它?我已經看到Siri會識別標點符號,所以我認爲它應該是可行的。

    1熱度

    1回答

    我目前正試圖複製一篇論文的作品,在論文中他們使用MFCC功能訓練cnn,而不需要在最後執行DCT。它基本上是濾波器組的能量的對數。 我知道kaldi可以使用make_mfcc.sh腳本來計算MFCC功能。但是,如果不能在最後執行DCT來改變腳本以計算MFCC,如果不是的話,是否還有其他工具可以做到這一點? 採取傅立葉變換的信號(的窗口化摘錄)的:如下 的MFCC通常衍生。 使用三角形重疊窗口將以上

    17熱度

    2回答

    我使用谷歌的這個API: - https://www.google.com/speech-api/v2/recognize?output=json&lang= 「+ LANGUAGE_CODE +」 &鍵=語音識別 「我的鑰匙」 ,它的工作非常好。 的問題是與數字即,如果我說one two three four結果將是1234 ,如果我說one thousand two hundred thirt

    0熱度

    1回答

    我的語音在F = 44100Hz處被採樣。每個樣品記錄2.5秒(2500毫秒)。我希望過濾掉所有的噪音,而不會影響數據。 我已經記錄了.wav格式的樣本,並且我正在使用Matlab進行噪聲過濾。我樣本中的噪音是基本噪音,即流量非常小,一些用於旋轉風扇,微動,呼吸,一些來自麥克風,以及一般靜音環境中的任何基本形式的噪音。 我應該使用哪種噪聲過濾技術? 我應該使用多種噪音過濾技術嗎?如果是這樣,我使用

    0熱度

    3回答

    我想要將語音識別附加到星號服務器。我想嘗試基於CMU Sphinx的離線解決方案。但它工作得很慢。重新編寫簡單字典(yes | no | normal)需要大約20秒。我使用這個命令: pocketsphinx_continuous \ -samprate 8000 \ -dict my.dic \ -lm ru.lm \ -hmm zero_ru.cd_c

    0熱度

    1回答

    我在這裏創建了一個TS3插件,它使用 System::Speech::Recognition作爲其SpeechRecognitinEngine。現在,我爲SpeechRecognized事件創建一個EventHandler。 那麼,我的日誌記錄(和插件的操作 - 無)告訴我,事件實際上從來沒有觸發過,即使你開始和停止與(有些)有效的(部分)語法交談。 我不知道這是爲什麼。它發生在用C++ CLI編