語音識別語言模型

我想將語音識別集成到我的Android應用程序中。語音識別語言模型

我知道谷歌提供了兩種語言模式（短語聽寫和網頁搜索的自由格式）。

但是，我的應用程序將有可能的詞數量有限（可能幾千）。是否可以指定詞彙表;將其限制在這些詞語中，以期達到更準確的結果？

我的直接想法是使用網絡搜索語言模型，然後根據我的詞彙檢查結果。

任何想法讚賞。

我認爲你的直覺是正確的，你已經回答了你自己的問題。

由google提供的內置語音識別功能僅支持聽寫和搜索語言模型。請參閱http://developer.android.com/reference/android/speech/RecognizerIntent.html

您可以使用這些識別器模型獲取結果，然後對結果進行分類或過濾，以找到最適合您的有限詞彙表的結果。有不同的技術可以做到這一點，他們可以從簡單的解析到複雜的統計模型。

我見過的唯一另一種選擇是在服務器上使用其他語音識別功能，以接受您的專用語言模型。雖然這是昂貴和複雜的，並被VLingo或龍或微軟的Bing等商業語音公司使用。

2010-10-14 12:54:09

您可以使用像Voxforge這樣的Opensource模型或像Lumenvox這樣的廉價模型。一些已被移植到android。我忘記了誰。

2010-12-27 22:19:31

我回答幾乎相同的問題之前 - 請點擊這裏：Building openears compatible language model

這裏：

通常需要非常大的語料庫產生有用的語言模型。

如果你只有少量的訓練數據，你的語言模型將被過度擬合，這意味着它不會推廣。

2011-10-05 01:37:59 Tilo

回答