2012-05-21 183 views
2

TTS語音是否存在(或可能存在)通用 TTS語音,即與某種語言(如英語或德語)無關的語音?通用文本到語音語音

我正在尋找一種方法來讀取不同國家的街道名稱與相同的聲音。

回答

3

目前沒有(我知道的或者搜索出現了)。

這是因爲大多數高質量的TTS引擎依靠預先錄製的單詞進行播放。對於這樣的TTS以所有語言以相同的語音說話,這意味着同一個人用所有這些語言記錄了他/她的聲音。今天大約有6500種語言,要用一種語言錄製字典,大約需要一個月的時間。因此,要記錄所有語言,需要541年。那個人到那時就已經死了。 請注意,這是誇張的:一個不需要逐字記錄字典的體面的TTS。

完成此操作所需的是完全由計算機生成的語音。然而,即使這樣也會分裂成方言,因爲法語強調不同的字母,然後說西班牙語。如果不是,那麼你可能會有一個TTS引擎演講Fringlish。

鑑於您在不同國家的街道名稱,最好的解決方案是使用espeak。它有很多內置的語言,並且始終聽起來是一樣的:機器人和沒有感情。它可以通過命令行調用,因此幾乎可以用於任何編程語言。

如果你知道街道所在的國家,你可以有一個他們在不同國家講什麼語言的數據庫。我曾經使用過geonames數據庫,它運行良好。然後,你可以用你想說的文字和語言呼叫espeak。 Geonames每天提供dump,您可以下載並提取語言。然後,您可以將大量數據庫存儲在服務器上,如Dotcloud。或者,您可以使用它們的API,但每天限制爲30,000次使用。

如果您不知道該街道所在的國家/地區的語言,那麼您可以選擇更粗略的方法,但這並不總是奏效。語言檢測。由於大部分街道名稱在不同國家都是真實的詞彙,例如'Main Street',你可以運行語言檢測,並找出使用這種方式的語言。我聽說detectlanguage.com對此很有幫助。

所以,雖然沒有現有的方法,你可以自己做一個,沒有太多的麻煩。

+0

他們真的需要記錄整個單詞嗎?我認爲他們會「只是」需要記錄音素。 –