1
我使用Sphinx4語法進行語音識別,但爲了另一個目的,我希望將其保存到用戶說的沒有語法的音頻文件。用Sphinx4將語音保存到音頻文件中
基本上,用戶說什麼,什麼時候靜音,音頻文件是創建的,我想知道我是否可以重用Sphinx4系統來執行此操作。如果是的話,我該怎麼做?
我使用Sphinx4語法進行語音識別,但爲了另一個目的,我希望將其保存到用戶說的沒有語法的音頻文件。用Sphinx4將語音保存到音頻文件中
基本上,用戶說什麼,什麼時候靜音,音頻文件是創建的,我想知道我是否可以重用Sphinx4系統來執行此操作。如果是的話,我該怎麼做?
不幸的是,此功能暫不支持。您需要實現您自己的DataProcessor,它將緩存音頻數據並通過API使其可用。如果你只是想甩話語,插入WavWriter組件到門前管道在配置文件中:
<item>speechMarker </item>
<item>nonSpeechDataFilter </item>
<item>wavWriter </item>
<item>preemphasizer </item>
<item>windower </item>
.......
如果你只是使用XML配置文件,您可以修改當前的文件。否則,您可以修改默認配置文件edu/cmu/sphinx/api/default.config.xml