2013-01-10 86 views
16

我最近開始學習OpenEars語音識別,太棒了!但是我還需要支持俄語,法語和德語等其他語言的語音識別和口述。我發現here可用各種聲學和語言模型。添加新的語言到OpenEars

但我無法真正理解 - 這足以滿足我在應用程序中整合額外語言支持的需求嗎?

問題是 - 我應該採取哪些步驟才能在Open Ears中成功集成俄語?

據我的理解 - 在打開耳朵演示英語所有聲學和語言模型位於夾hub4wsj_sc_8k。相同的文件可以在voxforge language archives中找到。所以我在演示中替換了它們。有一兩件事是不同的 - 在演示英語,還是sendump 2MB的大文件,這是不是位於voxforge語言archives.There在打開耳朵演示中使用其他兩個文件:

  • OpenEars1.languagemodel
  • OpenEars1.dic

這些I替換爲:

  • msu_ru_nsh.lm.dmp
  • msu_ru_nsh.dic

as .dmp與.languagemodel類似。但應用程序崩潰沒有任何錯誤。

我在做什麼錯?謝謝。

+6

嗨Guntis,OpenEars開發者在這裏。很高興你找到框架非常棒!對於這樣的問題,第1步是打開OpenEarsLogging和verbosePocketsphinx,它會給你非常細緻的信息,哪些是錯誤的(搜索你的控制檯輸出的單詞錯誤和警告,以節省時間)。有關這樣做的說明可以在文檔中找到。隨意向OpenEars論壇提出問題,因爲深入的故障排除不適合SO:http://politepix.com/forums/openears您可能還想看看這個主題:http:// politepix。 com/forums/topic/other-languages/ – Halle

+2

爲了跟進後面的讀者,開啓日誌後,我們通過使用mixture_weights文件作爲sendump的替代品並確保語音詞典使用了存在的音素在聲學模型中而不是在英語音素中。 – Halle

+0

@Halle你可以將此作爲回答發佈,因此問題不會保持開放嗎? –

回答

10

從我的意見,轉貼作爲一個答案:

[...]對於這樣的問題,第一步是打開OpenEarsLogging和verbosePocketsphinx,這會給你正在發生的事情非常細粒度信息錯誤(在控制檯輸出中搜索錯誤和警告以節省時間)。有關這樣做的說明可以在文檔中找到。隨意把問題給OpenEars論壇[...]:http://politepix.com/forums/openears你可能也想看看這個線程:http://politepix.com/forums/topic/other-languages

解決辦法:

要跟進後來的讀者,打開登錄後我們通過使用mixture_weights文件作爲sendump的替代品並確保語音詞典使用聲學模型中存在的音素而不是英語音素來實現這一目標。

中,我們做到了這一點故障排除的全面討論可以在這裏讀到:http://www.politepix.com/forums/topic/using-russian-acoustic-model/


更新:由於OpenEars 1.5本週發佈,有可能的路徑傳遞給任何聲學模型作爲參數到主要的聆聽方式,並且有一種更加標準化的方法來打包和參考任何聲學模型,這樣您就可以在同一個應用中使用許多聲學模型。此論壇帖子中的信息取代了我在此答案中鏈接到的討論中的信息:http://www.politepix.com/forums/topic/creating-an-acoustic-model-bundle-for-openears-1-5-and-up/由於歷史原因,我留下了其餘答案,並且因爲該討論中可能有些細節仍然有用,但它可以跳過青睞新的鏈接。

+0

謝謝!我相信這會幫助很多人,因爲您幫助了我:) –

+0

歡迎您,並感謝在故障排除過程中提供的質量輸入,從而幫助您輕鬆獲得幫助。 – Halle