我正在嘗試使用tensorflow-wavenet程序進行文本轉語音。如何使用tensorflow-wavenet
這些步驟如下:
- 下載Tensorflow
- 下載librosa
- 安裝要求
pip install -r requirements.txt
- 下載語料並投入命名爲 「文集」
- 列車機
python train.py --data_dir=corpus
目錄
- 生成音頻
python generate.py --wav_out_path=generated.wav --samples 16000 model.ckpt-1000
這樣做之後,我該如何生成文本文件的語音讀出?
如果tensorflow-wavenet除了產生亂碼之外無法做任何事情,是否有功能性程序可以將機器學習和語音生成結合起來創建真實的語音? – Lumo5
當然Deepmind不會透露所有的魔法,所以他們的論文缺乏描述他們如何做文本到語音生成所必需的局部調節。你還需要一種訓練數據,這種訓練數據的組織方式可以用來進行局部調節 - >將音頻與說出的文字結合起來......因此,你必須自己動手回購並自己做,或者等到其他天才會做它。 –