2012-01-17 30 views
0

是否有任何使用錄製的語音數據生成合成語音的開源內容項目? (以合成/模擬某個人的語音爲目標)作爲一個附註,是否有這個過程的名稱,目標或提取的數據?「語音簽名」?)FLOSS項目是否利用人工輸入進行語音合成?

我想象的工作流程是是這樣的:從標準化文本

  • 演講實錄(「泰迪熊坐在墊子上。」)
  • 挑選出音素(貓的「A」),佔口音
  • 得到,使得該數據愛麗絲的「呃」聲音與貝蒂的「呃」不一樣
  • 給文字渲染語音使用口音適當的音素加語音簽名

回答這個問題是在上訪Jack AngelTeddyWonkers)給他安慰語音簽名捐贈給人類的緣故公共領域中的關鍵步驟。

回答

1

以下是由卡內基梅隆大學贊助的open source project called festvox,該大學的目標是以特定演講者爲基礎構建合成語音。這裏介紹了這個概念,聽起來像是一個非常耗時的過程,才能正確調整它。在BableFish.org上有一個很好的Text-to-Speech開源項目列表。關於圍繞特定揚聲器構建TTS引擎的Text To Speech Blog進行了很好的討論。

+0

這正是我正在尋找的,謝謝! – d3vid 2012-01-17 13:59:01

相關問題