2014-06-09 207 views
-1

我正在尋找一個開源庫來檢測音頻文件(如wav文件)中使用的口語。音頻語言識別

我試過CMU sphinx,但不能理解如何使用它進行語言檢測?有人可以幫忙嗎?

回答

1

您可以在所有手機解碼模式下嘗試CMU sphinx。 培訓您希望識別的語言的模型。 挑選語言的假設分數最好

2

如果你願意學習另一個工具包,你應該考慮Kaldi [1]。它是一個開源語音識別工具包,在主幹中有揚聲器識別系統(使用類似的模型作爲語言識別系統),以及沙箱language_id中的實驗語言識別設置。檢出版本庫後,可以使用svn switch ^/sandbox/language_id切換到LID沙箱。 LID示例在egs/lre07中。

無論您使用哪種工具包,我都推薦使用基於i-Vector的系統而不是語音系統。基於i-Vector的系統將更容易設置,因爲它不需要轉錄本,而且速度更快,因爲它避免瞭解碼。