我想將語音識別集成到我的Android應用程序中。語音識別語言模型
我知道谷歌提供了兩種語言模式(短語聽寫和網頁搜索的自由格式)。
但是,我的應用程序將有可能的詞數量有限(可能幾千)。是否可以指定詞彙表;將其限制在這些詞語中,以期達到更準確的結果?
我的直接想法是使用網絡搜索語言模型,然後根據我的詞彙檢查結果。
任何想法讚賞。
我想將語音識別集成到我的Android應用程序中。語音識別語言模型
我知道谷歌提供了兩種語言模式(短語聽寫和網頁搜索的自由格式)。
但是,我的應用程序將有可能的詞數量有限(可能幾千)。是否可以指定詞彙表;將其限制在這些詞語中,以期達到更準確的結果?
我的直接想法是使用網絡搜索語言模型,然後根據我的詞彙檢查結果。
任何想法讚賞。
我認爲你的直覺是正確的,你已經回答了你自己的問題。
由google提供的內置語音識別功能僅支持聽寫和搜索語言模型。請參閱http://developer.android.com/reference/android/speech/RecognizerIntent.html
您可以使用這些識別器模型獲取結果,然後對結果進行分類或過濾,以找到最適合您的有限詞彙表的結果。有不同的技術可以做到這一點,他們可以從簡單的解析到複雜的統計模型。
我見過的唯一另一種選擇是在服務器上使用其他語音識別功能,以接受您的專用語言模型。雖然這是昂貴和複雜的,並被VLingo或龍或微軟的Bing等商業語音公司使用。
您可以使用像Voxforge這樣的Opensource模型或像Lumenvox這樣的廉價模型。 一些已被移植到android。我忘記了誰。
我回答幾乎相同的問題之前 - 請點擊這裏:Building openears compatible language model
這裏:
通常需要非常大的語料庫產生有用的語言模型。
如果你只有少量的訓練數據,你的語言模型將被過度擬合,這意味着它不會推廣。