voice-detection

    0熱度

    1回答

    有沒有人看到任何示例如何設置簡單的應用程序來訓練dnet,然後使用它來識別有限數量的語音命令而不綁定到特定語言?我相信Kaldi API對它來說非常強大,但缺乏文檔。

    10熱度

    4回答

    說明 我的申請記錄從手機麥克風的聲音。我正在使用android標準類(android.media.AudioRecord)來做到這一點。應用程序有2個按鈕「開始」和「停止」當我按下開始按鈕,應用程序啓動記錄,當我按下停止應用程序停止錄音並給我回緩衝區,與以.wav格式的語音數據。一切正常。 問題 我想改變我的應用程序以這種方式,當應用程序啓動開始分析聲音從麥克風來,如果用戶保持沉默申請繼續分析從麥

    1熱度

    1回答

    我編寫了一個shell腳本來訓練幾種GMM,用於某些種類的語音活動和靜音。因此我使用了LIUM揚聲器diarization工具包。我想用它來進行語音活動檢測。以下腳本通過使用Sphinx4從wav音頻文件中提取MFCC功能,在這些腳本上訓練GMM並應用維特比解碼進行分割。然而,結果非常差,即由此產生的分割是完全錯誤的。這肯定不是這種情況,因爲我將GMM應用於訓練集本身。我究竟做錯了什麼?我已經付出