3
我正在嘗試基於CMU Sphinx構建語音識別應用程序。 我使用lmtool創建了自己的語言模型。但爲了提高識別的準確性,我想調整獅身人面像。 但是,是否有任何指導選擇屬性,如absoluteBeamWidth,relativeBeamWidth,absoulteWordBeamWidth,languageWeight。 我不完全確定這些屬性的含義。此外,任何可以幫助我調整獅身人面像的資源鏈接(不包括獅身人面像網站上的未完成調整鏈接)將不勝感激。優化CMU獅身人面像
謝謝
確定那爲什麼我們使用像absoluteBeamWidth,relativeBeamWidth,absoulteWordBeamWidth和languageWeight屬性.... – Shishya
語音識別本質上是一個搜索正確的結果。梁通過刪除得分低於最好的變體來限制搜索。相對波束寬度影響分數是波束時間較小的路徑。絕對光束選擇每幀探測的絕對路徑數量。字束在這個特定的幀處考慮詞尾,而束只考慮所有路徑。較小的波束加速搜索,較寬的波束使其變慢。 語言權重控制語言模式的效果。通常在實驗過程中選擇它。 –
默認值通常是正確的,他們的調整沒有任何顯着的改善。 –