使用CMU Shinx，JSAPI和Google語音API的語音識別

語音識別是我當前項目的許多功能之一，它最有可能是在J2EE中開發的（其他語言在他們的選擇合理時也受到歡迎）。使用CMU Shinx，JSAPI和Google語音API的語音識別

google和SO上的大多數鏈接都建議上述三個選項，Sphinx 4，JSAPI直接和Google Speech API（向Google發送服務器調用並將結果作爲文本獲取）。

對我來說，其他免費提供的選項是什麼？如果我使用Sphinx-4，我怎樣才能使用通用英語的語言模型？

來源

2011-12-29 aProgrammer

是的，有。

可以使用Google語音識別器的包裝器，它基本是一行代碼。您可以發送FLAC或SPEEX格式的語音音頻，並獲得識別和置信度分數。唯一的問題是Google可以像谷歌翻譯那樣關閉API。
其他選項是使用獅身人面像（獅身人面像4或Pocketsphinx）。
可以使用HTK（http://htk.eng.cam.ac.uk/）並使用HVite（HTK解碼器）或其他類似Julius（http://julius.sourceforge.jp/en/）。還有其他選項可以使用HTK來訓練聲學模型和/或語言和語法。

Voxforge爲HTK和Sphinx提供了聲學和語言模型（http://voxforge.org/）。

來源

2011-12-29 16:52:04

這個答案是誤導性的。 HTK使用C語言，不適用於J2EE。它在應用程序中也不是免費的。 Voxforge不爲HTK和Sphinx提供語言模型。 – 2011-12-30 11:30:20

如果VoxForge不支持獅身人面像比他們提供模型爲什麼看到這個鏈接.. http://sourceforge.net/projects/cmusphinx/files/Acoustic%20and%20Language%20Models/這應該用於建立一個聽寫應用程序獅身人面像4 ..... – aProgrammer 2012-01-18 11:35:41

如果我使用Sphinx-4，我該如何獲得一般英語的語言模型以便與它一起使用？

您可以從CMUSphinx網站和其他地方下載它們。你也可以自己構建它們。其中一個可能的位置是

http://www.keithv.com/software/csr/

來源

2012-01-04 22:57:06

哪個版本我應該從上面的鏈接下載....你可以解釋一下readme.txt ....的步驟3,4和5嗎？我如何使用這些模型來構建聽寫應用程序？ – aProgrammer 2012-01-18 11:31:53

使用CMU Shinx，JSAPI和Google語音API的語音識別

回答

相關問題