在Android，法語上使用音素識別的Pocketsphinx識別準確度差

我正在研究一個項目，我必須將Pocketsphinx的語音功能集成到android應用程序中。事實上，我必須整合由Pocketpshinx提供的音位識別功能，這些功能應該能夠識別法語的音素，例如，（如「de」，「re」，「se」等），輔音（如「m」，「f」，「g」等），雙輔音（如「 kl「，」ks「，」gr「等）和元音（如」a「，」o「，」e「等）。現在，我已經集成了Pocketsphinx來識別上面提到的音素，但是我的結果非常糟糕。例如，當我發音爲「o」時，認可的結果有時是：「SIL ff ei au」（即使我根本沒有發音字母「f」和「e」），或者在開始時出現了其他的東西這不明顯。在開頭出現的字母並不總是相同的（有時我會得到「ll」，「uu」等）。但有時，我發音的字母出現在開頭（例如「a」，我得到「SIL aa SIL」），但這種情況很少發生。那麼，你們可以請幫助，讓我知道可能是什麼問題和解決這個問題的任何建議？我是否需要創建一個語言模型和一個字典，只有這些我感興趣的字母（因爲字母的數量是固定的）？或者，也許我需要做聲學模型的自適應，或者訓練聲學模型？在Android，法語上使用音素識別的Pocketsphinx識別準確度差

非常感謝您提前！

Leutrim

來源

2016-04-25 Leo

在模型中找到feat.params，並根據您的選擇改變-cmuinit價值，而且，「-kws_threshold」到1E-40F去除假警報值。

來源

2016-07-27 08:21:14

你能否詳述一下這些值？ – Vaiden

在Android，法語上使用音素識別的Pocketsphinx識別準確度差

回答

相關問題