2013-05-27 65 views
1

我想使用CMU sphinx4轉錄給定的音頻文件。它應該採用.wav格式的音頻文件並在印度英語中進行對話。我是CMUSphinx的新手,無法簡單描述過程。簡單的步驟使用CMU sphinx4

回答

7

您可能需要查看隨sphinx api提供的轉錄器演示。

您只需更改語言模型和聲學模型,在config.xml文件中配置相同,並使用相同的代碼即可。

  1. 語言模型 - 根據您的應用程序的使用情況,您可以用華爾街日報的語言模型有5K的話,也可以使自己的model.To使自己landuage模型,你可以閱讀更多here。一個簡單的方法是使用lmtool。谷歌「lmtool cmu」

  2. 聲學模型 - 因爲你想有一個印度口音的應用程序,你需要有印度英語的音頻文件和相應的轉錄文件。根據您的使用情況,您可以訓練自己的聲學模型,也可以調整現有的聲學模型。閱讀更多here。您也可以在線搜索數據集。

  3. 在config.xml文件中進行配置,以便您的應用程序使用您的語言和聲學模型。

對於一個初學者來說,這些步驟可能是helpful-

  1. 閱讀有關獅身人面像建築和嘗試演示關於語言模型是什麼
  2. 研究。
  3. 閱讀有關如何構建語言模型的信息。 (lmtool,cmuclmtk等)
  4. 閱讀有關聲學模型的內容。
  5. 閱讀有關如何訓練/改編聲學模型的內容。
  6. 在您的Java應用程序中配置config.xml文件以使用這些模型。