2012-11-13 61 views
3

我正在嘗試基於CMU Sphinx構建語音識別應用程序。 我使用lmtool創建了自己的語言模型。但爲了提高識別的準確性,我想調整獅身人面像。 但是,是否有任何指導選擇屬性,如absoluteBeamWidth,relativeBeamWidth,absoulteWordBeamWidth,languageWeight。 我不完全確定這些屬性的含義。此外,任何可以幫助我調整獅身人面像的資源鏈接(不包括獅身人面像網站上的未完成調整鏈接)將不勝感激。優化CMU獅身人面像

謝謝

回答

2

但序,以提高識別的準確性,我需要調整獅身人面像。

準確性沒有通過調整,而是通過使用更好的模型和更先進的算法來改善。查看常見問題的詳細信息:

http://cmusphinx.sourceforge.net/wiki/faq#qwhy_my_accuracy_is_poor

+0

確定那爲什麼我們使用像absoluteBeamWidth,relativeBeamWidth,absoulteWordBeamWidth和languageWeight屬性.... – Shishya

+3

語音識別本質上是一個搜索正確的結果。梁通過刪除得分低於最好的變體來限制搜索。相對波束寬度影響分數是波束時間較小的路徑。絕對光束選擇每幀探測的絕對路徑數量。字束在這個特定的幀處考慮詞尾,而束只考慮所有路徑。較小的波束加速搜索,較寬的波束使其變慢。 語言權重控制語言模式的效果。通常在實驗過程中選擇它。 –

+0

默認值通常是正確的,他們的調整沒有任何顯着的改善。 –