2
A
回答
2
如果你知道說話者所說的,您可以執行forced alignment生成單詞(或音素)時間對齊。工具包(如CMU Sphinx,HTK和Kaldi)可以執行此操作。如果不知道講話者說了什麼,則可以執行標準語音識別並使用時間信息來獲取字邊界,但識別輸出中可能存在錯誤。
0
沒有事先知道什麼短語已發音這個任務是相當具有挑戰性的。作爲您嘗試將VAD應用於演講並通過暫停將聲音分成單詞的方式之一。但是在發生自發言論的情況下,人們往往不會在某些詞語之間產生任何關係。所以肯定會有問題。
建議使用一些VAD庫here。
相關問題
- 1. 如何將一個字符串分成幾個字符塊?
- 2. 如何將一個字符串拆分成一個數組
- 3. Windows Mobile - 語音控制+語音合成(文字轉語音)
- 4. 將一個字節分成幾部分
- 5. 如何用一個語句將2d數組分成1d數組?
- 6. 如何將一個字符串分成多個組?
- 7. 如何將一個長整數分成3個字符集?
- 8. 如何將一個字符串分成5個變量?
- 9. 如何將一個字符串切成3個部分?
- 10. 如何將一個字符串通過分隔符分割成一個數組?
- 11. 如何使一個HTML語音按鈕
- 12. 將一個字符串分成多行
- 13. 將一個字符串分成四組
- 14. 如何在文本到語音合成期間停止語音?
- 15. 如何更改合成語音語音UWP?
- 16. 如何在應用程序中選擇語音合成語音
- 17. 如何將文字分成兩部分
- 18. 斯卡拉:如何將一個字符串分解成地圖
- 19. 如何將一個字符串分成幾對
- 20. 如何將一個段落分成小的子字符串?
- 21. 如何將一個字節分成4對2位
- 22. 語音文字到語音
- 23. 如何將1個字符串分成多個字符串
- 24. 如何將一個MySQL語句分配給一個PHP變量
- 25. 如何將一個NSArray分成兩個相等的部分?
- 26. 如何將一個字符串分成多個字符串並重建它?
- 27. 如何將一行分成兩部分?
- 28. 如何將一個句子(字符串)分解成一個列表([String])?
- 29. 德爾福7:如何將一個字符串拆分成一個TStringList
- 30. 我如何在Kotlin中將一個字符串分割成一個數組?
爲了記錄,我維護強制對齊aeneas:https://github.com/readbeyond/aeneas/ |正如Paul Dixon所說,如果你知道發音的文字,這可能是一個選擇。否則,您需要使用一個ASR系統。 –