2016-04-25 27 views
1

我正在研究一個項目,我必須將Pocketsphinx的語音功能集成到android應用程序中。事實上,我必須整合由Pocketpshinx提供的音位識別功能,這些功能應該能夠識別法語的音素,例如, (如「de」,「re」,「se」等),輔音(如「m」,「f」,「g」等),雙輔音(如「 kl「,」ks「,」gr「等)和元音(如」a「,」o「,」e「等)。 現在,我已經集成了Pocketsphinx來識別上面提到的音素,但是我的結果非常糟糕。例如,當我發音爲「o」時,認可的結果有時是:「SIL ff ei au」(即使我根本沒有發音字母「f」和「e」),或者在開始時出現了其他的東西這不明顯。在開頭出現的字母並不總是相同的(有時我會得到「ll」,「uu」等)。但有時,我發音的字母出現在開頭(例如「a」,我得到「SIL aa SIL」),但這種情況很少發生。 那麼,你們可以請幫助,讓我知道可能是什麼問題和解決這個問題的任何建議?我是否需要創建一個語言模型和一個字典,只有這些我感興趣的字母(因爲字母的數量是固定的)?或者,也許我需要做聲學模型的自適應,或者訓練聲學模型?在Android,法語上使用音素識別的Pocketsphinx識別準確度差

非常感謝您提前!

Leutrim

回答

1

在模型中找到feat.params,並根據您的選擇改變-cmuinit價值,而且,「-kws_threshold」1E-40F去除假警報值。

+0

你能否詳述一下這些值? – Vaiden