voice-detection

0熱度

1回答

有沒有人看到任何示例如何設置簡單的應用程序來訓練dnet，然後使用它來識別有限數量的語音命令而不綁定到特定語言？我相信Kaldi API對它來說非常強大，但缺乏文檔。

10熱度

4回答

說明我的申請記錄從手機麥克風的聲音。我正在使用android標準類（android.media.AudioRecord）來做到這一點。應用程序有2個按鈕「開始」和「停止」當我按下開始按鈕，應用程序啓動記錄，當我按下停止應用程序停止錄音並給我回緩衝區，與以.wav格式的語音數據。一切正常。問題我想改變我的應用程序以這種方式，當應用程序啓動開始分析聲音從麥克風來，如果用戶保持沉默申請繼續分析從麥

1熱度

1回答

使用LIUM的語音活動檢測（VAD/SAR）

我編寫了一個shell腳本來訓練幾種GMM，用於某些種類的語音活動和靜音。因此我使用了LIUM揚聲器diarization工具包。我想用它來進行語音活動檢測。以下腳本通過使用Sphinx4從wav音頻文件中提取MFCC功能，在這些腳本上訓練GMM並應用維特比解碼進行分割。然而，結果非常差，即由此產生的分割是完全錯誤的。這肯定不是這種情況，因爲我將GMM應用於訓練集本身。我究竟做錯了什麼？我已經付出