我在C#中開發了一個應用程序,它嘗試使用Skype ActiveX和Microsoft的語音識別引擎識別pc-to-land電話呼叫中的短語,並通過tcp/ip端口重定向呼叫。C#和Skype語音識別
在手機中,機器播放錄音,所以語音非常清晰。但System.Speech
和Microsoft.Speech
都不能識別任何有用的東西。
它已將語法加載到期望的選項,但沒有任何內容。如果我說話,我必須說一個字,等到它識別出這個單詞,然後說出下一個單詞,這樣才能起作用。
問題是,我該如何改進?或者你知道一個可以在現場對話中做得更好的ASR?
語音識別幾乎不可能解決。蘋果Siri似乎是迄今爲止唯一一家在最好的情況下完成了可以接受的工作的人。 – MrFox
是的,我知道,我在失敗的研究中失去了很多時間。現在我在思考,由於我所記錄的是,我可能會將音頻流與我想要捕捉的原始錄音的部分進行比較。我會盡量做一個aproximation,但任何建議將受到高度的歡迎。 – Gabriel
建議將是:停止浪費你的時間,並做一些事情,你可能會得到一些結果。除非你非常聰明,有很多時間,並且確切地知道你在做什麼,在這種情況下你不會在這裏問。 – MrFox