2012-08-02 40 views
1

我可以將語音識別與C#集成嗎?我想開發一個能識別我們方言的應用程序。我仍在收集音頻文件以使其與演講者無關。我可以將語音識別與C#集成嗎?

  1. 我應該使用什麼模型?語言還是聲學?
  2. 你會推薦什麼工具?
+2

您需要支持哪些平臺?我相信答案會根據這些需求而變化。另外 - 你想使用一個庫或自己寫這個? – Ani 2012-08-02 15:52:16

+0

從我研究的內容來看,確實有一個用於語音識別的庫以及系統可能識別的內置語言。但就我而言,他們不支持我們的語言。我想我需要自己構建它。你有什麼建議嗎?謝謝。 – 2012-08-02 16:05:01

+0

@BoyKarton一個小調。當您按幾次輸入(就像您輸入一個單詞時),系統會自動在您的問題中插入換行符,因此您不必擔心自己放入'
'。 – 2012-08-02 16:25:57

回答

1

您是否試過Microsoft Speech API? MSDN包含一個C# getting started tutorial

+0

還沒有嘗試過。因爲每次我搜索語音識別時,只會導致「構建聲學/語言模型」,訓練您的計算機等。您是否有任何關於此教程的鏈接?謝謝。 – 2012-08-02 16:09:20

+0

感謝您的更新,但我的問題是,它不支持我們的語言,菲律賓文字。據我所知,它沒有任何內置的庫可以支持識別我們的語言。 – 2012-08-02 16:45:09

+0

你可以嘗試聯繫Nuance(www.nuance.com)。他們的Recognizer產品理解79種語言,但可悲的不是菲律賓人。 – 2012-08-02 16:52:19

1

編寫一個語音識別系統是一個非常複雜的話題,許多論文已被寫入關於這一主題。這裏有一些不錯的入門篇:

  1. http://www.speech-recognition.de/pdf/introSR.pdf
  2. http://www.cs.columbia.edu/~mcollins/6864/slides/asr.pdf
  3. http://www.cs.rochester.edu/u/james/CSC248/Lec12.pdf

雖然上述文件處理光譜建模,特徵向量提取,集羣和數據映射的基本知識,我的寵物接近這種複雜的分類問題一直是基於神經網絡的。下面是與不同的基於神經網絡的方法處理了一套試卷:

  1. http://www.cslu.ogi.edu/tutordemos/nnet_recog/recog.html
  2. http://www.ll.mit.edu/publications/journal/pdf/vol01_no1/1.1.7.neuralnetworks.pdf
  3. http://www.ru.lv/~peter/zinatne/ebooks/(Brain%20Study)_Speech%20Recognition%20using%20Neural%20Networks.pdf
  4. http://www.cs.toronto.edu/~ruiyan/csc411/ANNSpeechRecognition.pdf

我會建議你從小處着手,並建立系統在一點點的步驟。祝你好運!

只是出於好奇 - 什麼語言你需要支持?

+0

+1,因爲我對該語言也很好奇。 – 2012-08-02 16:26:35

+0

是的。我打算首先製作一個小應用程序。雖然我在語音識別方面仍然是新手。我想支持菲律賓的話,我來自菲律賓。謝謝您的幫助。 – 2012-08-02 16:37:08

+0

@BoyKarton你見過[this](http://www.eee.upd.edu.ph/content/speaker-independent-continuous-speech-recognition-filipino-speech-corpus)嗎? – 2012-08-02 18:36:21