speech-recognition

0熱度

1回答

我正在使用android語音識別器，並在幾秒鐘後停止收聽？什麼是解決方案？在結束或錯誤

0熱度

1回答

讀取其他Q & A是在計算器和CMUSphinx的官方網站上的信息，我讀到我必須調整閾值，但沒有人確切地說，閾值是多少。我明白，如果閾值的值越大，那麼你就有更大的機會得到有效的結果，但你可以放鬆一些，如果閾值越小，那麼你不會失去結果，但你會得到一些無效...（a在一些情況下它們很多）。我試圖進行關鍵字搜索，但找不到適用於我的關鍵字閾值的適當值。任何人都可以解釋這件事情是如何運作具體的問題：當你犯

0熱度

1回答

Microsoft Bing Speech API SDK在一段時間後會停止收聽

我使用Microsoft Bing Speech API來進行一些語音到文本任務。以下是我如何編碼， MicrophoneRecognitionClient micClient; micClient = SpeechRecognitionServiceFactory.CreateMicrophoneClient(SpeechRecognitionMode.LongDictation, "en-

3熱度

3回答

如何在Android上錄製語音事物

我正在研究RPi3上Android Things的SDK的預覽版2。嘗試錄音機以及媒體錄音機，仍然無法獲取音頻捕獲。我正在試圖將我的演講轉換爲文字。不支持常規SpeechRecognition。我有USB MIC直接連接到RPi3以及通過USB聲卡連接到RPi3的耳機MIC。 MediaRecorder代碼： private void startRecording() { Log.d(T

1熱度

1回答

帶標點符號的語音識別

在對語音框架進行了一些測試後，我意識到結果中沒有標點符號。有沒有辦法觸發它？我已經看到Siri會識別標點符號，所以我認爲它應該是可行的。

1熱度

1回答

提取沒有日誌的MFCC係數？

我目前正試圖複製一篇論文的作品，在論文中他們使用MFCC功能訓練cnn，而不需要在最後執行DCT。它基本上是濾波器組的能量的對數。我知道kaldi可以使用make_mfcc.sh腳本來計算MFCC功能。但是，如果不能在最後執行DCT來改變腳本以計算MFCC，如果不是的話，是否還有其他工具可以做到這一點？採取傅立葉變換的信號（的窗口化摘錄）的：如下的MFCC通常衍生。使用三角形重疊窗口將以上

17熱度

2回答

有沒有辦法強制Google語音api只返回單詞作爲響應？

我使用谷歌的這個API： - https://www.google.com/speech-api/v2/recognize?output=json&lang= 「+ LANGUAGE_CODE +」 &鍵=語音識別「我的鑰匙」，它的工作非常好。的問題是與數字即，如果我說one two three four結果將是1234 ，如果我說one thousand two hundred thirt

0熱度

1回答

在matlab語音應用中進行噪聲過濾的最佳方法是什麼？

我的語音在F = 44100Hz處被採樣。每個樣品記錄2.5秒（2500毫秒）。我希望過濾掉所有的噪音，而不會影響數據。我已經記錄了.wav格式的樣本，並且我正在使用Matlab進行噪聲過濾。我樣本中的噪音是基本噪音，即流量非常小，一些用於旋轉風扇，微動，呼吸，一些來自麥克風，以及一般靜音環境中的任何基本形式的噪音。我應該使用哪種噪聲過濾技術？我應該使用多種噪音過濾技術嗎？如果是這樣，我使用

0熱度

3回答

如何減少CMU Sphinx中的語音識別時間？

我想要將語音識別附加到星號服務器。我想嘗試基於CMU Sphinx的離線解決方案。但它工作得很慢。重新編寫簡單字典（yes | no | normal）需要大約20秒。我使用這個命令： pocketsphinx_continuous \ -samprate 8000 \ -dict my.dic \ -lm ru.lm \ -hmm zero_ru.cd_c

0熱度

1回答

語音識別不會在C++/CLI DLL中觸發EventHandler

我在這裏創建了一個TS3插件，它使用 System::Speech::Recognition作爲其SpeechRecognitinEngine。現在，我爲SpeechRecognized事件創建一個EventHandler。那麼，我的日誌記錄（和插件的操作 - 無）告訴我，事件實際上從來沒有觸發過，即使你開始和停止與（有些）有效的（部分）語法交談。我不知道這是爲什麼。它發生在用C++ CLI編