如何在.NET中實現語音識別?.NET中的語音識別
我有一堆.mp3
與計算機生成的聲音相對較高的質量。在每個.mp3
聲音說一些隨機文本,然後在英語中的6-7位數字序列。我想提取這些數字作爲文本。
是否有可能在.NET中實現這樣的事情?
如何在.NET中實現語音識別?.NET中的語音識別
我有一堆.mp3
與計算機生成的聲音相對較高的質量。在每個.mp3
聲音說一些隨機文本,然後在英語中的6-7位數字序列。我想提取這些數字作爲文本。
是否有可能在.NET中實現這樣的事情?
您可以使用微軟的語音到文本引擎。其易於使用的
有些樣品here
您可以使用Microsoft SAPI SDK:
http://www.microsoft.com/downloads/details.aspx?FamilyID=5e86ec97-40a7-453f-b0ee-6583171b4530&DisplayLang=en
查覈在SAPI SDK的C#示例。
這裏有一個鏈接到the System.Speech.Recognition namespace,可以幫助你。
使用語音識別時,最好的辦法是在Windows Vista或Windows 7中工作,因爲他們有Microsoft SAPI(Speech API)5.3(並且很快會有5.4),並且與SAPI 5.1相比,性能有很大的不同從Windows XP。
現在,here你有一個視頻和源代碼(用C++編寫,但你可以將它傳遞給另一種語言)的應用程序,幾乎做你想做的。
爲了更好地識別單詞,他們用他們想識別的單詞創建一個語法文件。你可以看到這個視頻,你會發現,製作你想要的東西會很容易。
祝你好運!
是的,這是最好的方法。自3.0版以來,語音識別/ TTS已成爲.NET BCL的一部分。 – Noldorin