2010-03-10 25 views
1

在尋找一種使用語音識別的方式時,我使用VoiceXML交叉路徑。我已經通過了W3C的描述,但我仍然有一些疑惑。什麼是VoiceXML?

我可以簡單地創建一個vxml文檔並將其放置在我的網絡服務器上嗎?有什麼要求?

它會工作嗎?

我可以通過互聯網輸入麥克風嗎?

我似乎找不到直接的答案。

回答

1

您需要相當於知道如何處理VoiceXML的瀏覽器。

我在電信行業工作,這通常意味着通過舊式電話連接或通過VoIP連接到公用電話網絡的軟件。這方面有許多商業和一些開源解決方案。

還有一些其他的實現,如Opera和可訪問區域的一些研究計劃,但我沒有看到它們聚集很多。

我不會將VoiceXML看作是處理語音識別的最簡單方法。也就是說,有沒有簡單的方法和許多免費/開源解決方案。微軟平臺上最簡單的途徑是查看微軟的SAPI層以及他們提供的免費,最小的ASR。在Linux方面,請查看CMU Sphinx

1

VoiceXML是一種標記旨在通過語音(通常是電話)傳送的內容的方式。就像HTML一樣,您將通過Web瀏覽器顯示的內容進行格式化,VoiceXML就是您將它傳送到手機的方式。

VoiceXML本身不會進行語音識別。但是許多VoiceXML提供商還將語音識別(也稱爲ASR)引擎與其VoiceXML平臺捆綁在一起。

如果您正在尋找一種方法來識別來自計算機上的麥克風的語音輸入到某種桌面應用程序中,那麼VoiceXML可能不是您要查找的內容。

維基百科在http://en.wikipedia.org/wiki/List_of_speech_recognition_software

的一些語音識別軟件的列表。如果你想了解更多有關VoiceXML的,有一個在http://vxml.org/

一些好的文檔