2011-12-29 125 views
1

語音識別是我當前項目的許多功能之一,它最有可能是在J2EE中開發的(其他語言在他們的選擇合理時也受到歡迎)。使用CMU Shinx,JSAPI和Google語音API的語音識別

googleSO上的大多數鏈接都建議上述三個選項,Sphinx 4,JSAPI直接和Google Speech API(向Google發送服務器調用並將結果作爲文本獲取)。

對我來說,其他免費提供的選項是什麼?如果我使用Sphinx-4,我怎樣才能使用通用英語的語言模型?

回答

3

是的,有。

  1. 可以使用Google語音識別器的包裝器,它基本是一行代碼。您可以發送FLAC或SPEEX格式的語音音頻,並獲得識別和置信度分數。唯一的問題是Google可以像谷歌翻譯那樣關閉API。
  2. 其他選項是使用獅身人面像(獅身人面像4或Pocketsphinx)。
  3. 可以使用HTK(http://htk.eng.cam.ac.uk/)並使用HVite(HTK解碼器)或其他類似Julius(http://julius.sourceforge.jp/en/) 。還有其他選項可以使用HTK來訓練聲學模型和/或語言和語法。

Voxforge爲HTK和Sphinx提供了聲學和語言模型(http://voxforge.org/)。

+0

這個答案是誤導性的。 HTK使用C語言,不適用於J2EE。它在應用程序中也不是免費的。 Voxforge不爲HTK和Sphinx提供語言模型。 – 2011-12-30 11:30:20

+0

如果VoxForge不支持獅身人面像比他們提供模型爲什麼看到這個鏈接.. http://sourceforge.net/projects/cmusphinx/files/Acoustic%20and%20Language%20Models/這應該用於建立一個聽寫應用程序獅身人面像4 ..... – aProgrammer 2012-01-18 11:35:41

2

如果我使用Sphinx-4,我該如何獲得一般英語的語言模型以便與它一起使用?

您可以從CMUSphinx網站和其他地方下載它們。你也可以自己構建它們。其中一個可能的位置是

http://www.keithv.com/software/csr/

+0

哪個版本我應該從上面的鏈接下載....你可以解釋一下readme.txt ....的步驟3,4和5嗎?我如何使用這些模型來構建聽寫應用程序? – aProgrammer 2012-01-18 11:31:53