2

我有一些音頻文件在不同的聲音(只有說話的話沒有音樂或噪音)。 我的目標改變了這一切對於音頻一個標準的語音「人」的聲音,例如音頻文件的語音轉換器

例如:

  • 輸入:音頻文件中的女人/男人的聲音說「Hello World」的。
  • 輸出:音頻文件說相同,但在曼語音。

Java能做到嗎?

+1

所以你想要一個男人的聲音在早上叫醒你.. – 2013-05-14 08:19:26

+1

我正在使用這個文件來教英語,孩子們聽的聲音,他們在他後面重複。所以我不想使用多個聲音,因爲這會混淆他們。 – 2013-05-14 09:25:10

+1

這是可愛! – 2013-05-14 09:44:07

回答

1

您可能有兩個步驟解決此問題:

  1. 您需要一個Java 語音識別工具。我推薦使用Sphinx。我已經使用過它,它可以工作(不完美,但它工作得很好)。看看這個hello worlddemo
  2. 您需要一個文本到語音工具。我強烈建議FreeTTS。默認情況下,只有3個男性聲音可用,但很容易導入女性聲音。這link將引導你完成這個過程。我可以看到,有一個女聲avaliable有:

還的FreeTTS接口與MBROLA合成,並且可以使用MBROLA 聲音。有三種可用美國英語MBROLA聲音:

> 16kHz的女性(mbrola1) 16kHz的男性(mbrola2) 16kHz的男性(mbrola3)

+0

謝謝,只是爲了確定,你的意思是我必須將語音轉換爲文本,然後將文本轉換爲語音?「好主意」 是唯一的方法嗎?我可以直接做語音轉換嗎? – 2013-05-14 10:04:37

+0

是的,這個想法是一個雙重轉換,從語音到文本,然後是文本到語音。我知道這有點令人沮喪,但我並不認爲有Java語音轉換工具。與文本到語音或語音到文本程序相比,擁有這樣的軟件並不實際。正因爲如此,你可能不得不用它們來實現你想要的; ) – 2013-05-14 10:09:29

+0

謝謝你的幫助:)。 如果你擅長這個,你可以給我一個這個想法的演示代碼嗎?! 還是很難實現? 再次感謝你:) – 2013-05-14 17:47:16

0

有算法來進行語音轉換,但我懷疑它們是用Java實現的。一個好的語音轉換腳本是http://festvox.org/文本到語音合成系統的一部分。

不過,轉換的結果並不是很自然。轉換後的聲音聽起來不像人類,它包含噪音,語調並不總是自然的,等等。我誠懇地建議你考慮使用人類的聲音進行教學。