2012-05-10 45 views
0

我有一個項目需要在網站中實現語音識別。 想象一下,用戶正在進行視頻通話,也沒有任何交互手的空間。 只要它能識別一些關鍵字(如「快照」或「菜單」)就足夠了。使用Internet Explorer 8進行語音識別

我知道它在Chrome(x-webkit-speech)中工作,但它必須在IE8中。

其他條件:

  • 如果可能的錄音應該是(權當網頁打開時),所有的時間。因此,即使用戶正在與其他人交談,如果它聽到關鍵字,它也應該做出反應。我不想要像SIRI這樣的東西,你按一個按鈕開始錄製
  • 電話是非常機密的。我這樣做的公司不希望將整個對話發送給Google,在那裏可以分析和保存內容。

我不希望任何人給我一個完整的解決方案,但因爲我真的很新的這個和着急,我想如果有人能在正確的方向:)

點我欣賞

謝謝!

+0

如果您需要定位IE,您應該探索[SilverLight](http://forums.silverlight.net/t/184696.aspx)。 – Filburt

回答

1

我只是無意中發現了我自己的問題...... 這裏是我的解決方案:

我們用閃光燈拍攝的聲音。 將其轉換爲.wav。 連接到c#服務器的套接字並將該文件作爲字節數組發送。 問題: 由於您只接收字節,因此客戶端首先發送大小並用某種字符終止它,以便知道它何時結束。 你不能隨便使用一個字符並用它終止wav文件。如果你沒有掌握規模,你永遠不會知道傳輸何時完成。

c#-server使用.NET 4運行。具有語音識別功能。 分析.wav文件並將字符串發送回客戶端。閃光燈可以在JavaScript中調用方法=>問題解決了!

當然這很糟糕,但我們的客戶對它仍然很滿意,因爲它工作並滿足了他所要求的所有條件。