音頻語言識別

-1

我正在尋找一個開源庫來檢測音頻文件（如wav文件）中使用的口語。音頻語言識別

我試過CMU sphinx，但不能理解如何使用它進行語言檢測？有人可以幫忙嗎？

2014-06-09 rahul1990

您可以在所有手機解碼模式下嘗試CMU sphinx。培訓您希望識別的語言的模型。挑選語言的假設分數最好

2014-06-11 18:06:20 user1147663

如果你願意學習另一個工具包，你應該考慮Kaldi [1]。它是一個開源語音識別工具包，在主幹中有揚聲器識別系統（使用類似的模型作爲語言識別系統），以及沙箱language_id中的實驗語言識別設置。檢出版本庫後，可以使用svn switch ^/sandbox/language_id切換到LID沙箱。 LID示例在egs/lre07中。

無論您使用哪種工具包，我都推薦使用基於i-Vector的系統而不是語音系統。基於i-Vector的系統將更容易設置，因爲它不需要轉錄本，而且速度更快，因爲它避免瞭解碼。

來源

2014-10-17 01:32:20

音頻語言識別

回答

相關問題