1
我想使用CMU sphinx4轉錄給定的音頻文件。它應該採用.wav格式的音頻文件並在印度英語中進行對話。我是CMUSphinx的新手,無法簡單描述過程。簡單的步驟使用CMU sphinx4
我想使用CMU sphinx4轉錄給定的音頻文件。它應該採用.wav格式的音頻文件並在印度英語中進行對話。我是CMUSphinx的新手,無法簡單描述過程。簡單的步驟使用CMU sphinx4
您可能需要查看隨sphinx api提供的轉錄器演示。
您只需更改語言模型和聲學模型,在config.xml文件中配置相同,並使用相同的代碼即可。
語言模型 - 根據您的應用程序的使用情況,您可以用華爾街日報的語言模型有5K的話,也可以使自己的model.To使自己landuage模型,你可以閱讀更多here。一個簡單的方法是使用lmtool。谷歌「lmtool cmu」
聲學模型 - 因爲你想有一個印度口音的應用程序,你需要有印度英語的音頻文件和相應的轉錄文件。根據您的使用情況,您可以訓練自己的聲學模型,也可以調整現有的聲學模型。閱讀更多here。您也可以在線搜索數據集。
在config.xml文件中進行配置,以便您的應用程序使用您的語言和聲學模型。
對於一個初學者來說,這些步驟可能是helpful-