2014-10-04 24 views
0

我想創建一個識別阿拉伯文字母的模型。我知道如何創建語言模型和字典文件,但是我陷入了聲學模型。我爲每封信都記錄了wav文件,但是在培訓期間,它說培訓時間雖然仍然很短,但是訓練時間太短。當我嘗試使用它時,模型不會識別任何東西(給出null)。聲學型號小時數

我想知道我應該怎麼記錄wav文件,我應該不斷重複,例如,信阿利夫像100次,一個wav文件,或者我應該只是記錄相同字母的多個wav文件。

非常感謝您的幫助。

回答

1

我想知道如何記錄wav文件,我應該不斷重複,例如,在一個wav文件中像100次這樣的字母Alif,或者我應該只記錄同一個字母的多個wav文件。

最好有多個連續文字的文件,不要用字母。信件很難辨認。

當我嘗試使用它時,模型無法識別任何東西(給出null)。

這裏可能有不同的問題(錯誤的音頻格式等)。您可以使用Dropbox在CMUSphinx論壇上共享您的數據庫,以獲得有關此問題的幫助。

+0

但我的申請是識別字母,如果我使用你的建議,那麼我無法識別字母,因爲我將在語言模型中使用單詞而不是字母。那麼我的模型應該如何? – coding4fun 2014-10-06 09:59:25

+0

重新設計您的應用程序以識別單詞而不是字母。在當前的技術狀態下,字母很難識別。例如,對於英文RADIO字母表而不是字母「ALPHA,BRAVO,CHARLIE,DELTA ....」 – 2014-10-06 10:02:34