2010-10-05 55 views
0

我想創建一個基於自動語音識別的原型來處理報告。基於語音識別的原型

需求目前還不確定,但起初我會得到一些虛擬數據集。起初,我將專注於聲音信號的輸入和進一步處理。

我真的不知道如何下手,其開發環境,編程語言,...

我寧願與Visual Studio的工作,因爲我已經有一個許可證,但我虛心提議。

你有一些教程,想法,經驗?

回答

1

(我重用我發送給朋友最近的電子郵件,我希望這是有益的)

微軟語音引擎的兩種形式:臺式機和服務器。桌面語音引擎隨附各種產品,包括:MS Office 2003,Windows Vista和Windows 7.服務器語音引擎隨Office Communications Server(OCS)和統一通信管理API(UCMA)提供。

桌面語音引擎通常帶有聽寫語法。它針對桌面使用進行了優化,可以從多個進程共享。這將允許您使用桌面識別器的單個實例,並向Excel和Word發出語音命令。桌面識別器可以通過COM SAPI API或.NET System.Speech命名空間進行編程。

服務器語音引擎不附帶任何語法。它針對服務器使用進行了優化。我相信它也針對電話使用進行了優化。它專爲高音量情況而設計。服務器語音引擎可以通過COM SAPI API或.NET Microsoft.Speech命名空間進行編程。

服務器語音引擎被打包到一個名爲「Microsoft服務器語音平臺」的新的免費可再發行組件包中。我假設下一個版本的OCS(產品名爲Lync-http://www.microsoft.com/en-us/lync/default.aspx)也將包含相同的Microsoft服務器語音平臺。

Microsoft服務器語音平臺可作爲免費的可再發行版本下載。它有三個部分:SDK,運行時和語言。有26種語言可供選擇。有關背景信息,請參閱http://blogs.msdn.com/b/speak/archive/2010/03/30/microsoft-server-speech-platform-10-1-released-sr-and-tts-in-26-languages.aspx。自該博客發佈以來,微軟已經悄然發佈了10.2版本的微軟服務器語音平臺。他們也可供下載:

SDK:http://www.microsoft.com/downloads/en/details.aspx?FamilyID=1b1604d3-4f66-4241-9a21-90a294a5c9a4&displaylang=en

運行:http://www.microsoft.com/downloads/en/details.aspx?FamilyID=bb0f72cb-b86b-46d1-bf06-665895a313c7&displaylang=en

語言:http://www.microsoft.com/downloads/en/details.aspx?FamilyID=47ffd4e5-e682-4228-8058-dd895252a3c3&displaylang=en

+0

,我可以我去然後編程語言? – Tyzak 2010-10-07 10:10:27

+0

它提供了.NET API。您可以使用任何.NET語言和Visual Studio。 – 2010-10-07 13:52:33

+0

正如您發佈的其他問題所述,請參閱過時但有用的MSDN文章,網址爲http://msdn.microsoft.com/en-us/magazine/cc163663.aspx – 2010-10-07 13:54:58