2013-01-04 119 views
1

我在C#中開發了一個應用程序,它嘗試使用Skype ActiveX和Microsoft的語音識別引擎識別pc-to-land電話呼叫中的短語,並通過tcp/ip端口重定向呼叫。C#和Skype語音識別

在手機中,機器播放錄音,所以語音非常清晰。但System.SpeechMicrosoft.Speech都不能識別任何有用的東西。

它已將語法加載到期望的選項,但沒有任何內容。如果我說話,我必須說一個字,等到它識別出這個單詞,然後說出下一個單詞,這樣才能起作用。

問題是,我該如何改進?或者你知道一個可以在現場對話中做得更好的ASR?

+0

語音識別幾乎不可能解決。蘋果Siri似乎是迄今爲止唯一一家在最好的情況下完成了可以接受的工作的人。 – MrFox

+0

是的,我知道,我在失敗的研究中失去了很多時間。現在我在思考,由於我所記錄的是,我可能會將音頻流與我想要捕捉的原始錄音的部分進行比較。我會盡量做一個aproximation,但任何建議將受到高度的歡迎。 – Gabriel

+0

建議將是:停止浪費你的時間,並做一些事情,你可能會得到一些結果。除非你非常聰明,有很多時間,並且確切地知道你在做什麼,在這種情況下你不會在這裏問。 – MrFox

回答

2

最直接的方法是使用專門爲該任務設計的工具,而不是使用手工製作的skype/activex解決方案。

有一些特殊的軟件可以將電話連接到可操作的地方。他們中的一些:

Asterisk

Freeswitch

所有這些系統提供語音識別和交互式語音應答功能,通過MRCP協議。設置最簡單的方法識別是使用CMUSphinx toolkit

你可以閱讀更多關於CMUSphinx融入IVR系統herehere

如果你希望很快開始,有清涼SAAS解決方案,幫助您建立一個點擊幾下電話應用程序。例如Voxeo

+0

完美!我會看看這些服務。謝謝。 – Gabriel