通用文本到語音語音

TTS語音是否存在（或可能存在）通用 TTS語音，即與某種語言（如英語或德語）無關的語音？通用文本到語音語音

我正在尋找一種方法來讀取不同國家的街道名稱與相同的聲音。

2012-05-21 Sebastian Krysmanski

目前沒有（我知道的或者搜索出現了）。

這是因爲大多數高質量的TTS引擎依靠預先錄製的單詞進行播放。對於這樣的TTS以所有語言以相同的語音說話，這意味着同一個人用所有這些語言記錄了他/她的聲音。今天大約有6500種語言，要用一種語言錄製字典，大約需要一個月的時間。因此，要記錄所有語言，需要541年。那個人到那時就已經死了。 請注意，這是誇張的：一個不需要逐字記錄字典的體面的TTS。

完成此操作所需的是完全由計算機生成的語音。然而，即使這樣也會分裂成方言，因爲法語強調不同的字母，然後說西班牙語。如果不是，那麼你可能會有一個TTS引擎演講Fringlish。

鑑於您在不同國家的街道名稱，最好的解決方案是使用espeak。它有很多內置的語言，並且始終聽起來是一樣的：機器人和沒有感情。它可以通過命令行調用，因此幾乎可以用於任何編程語言。

如果你知道街道所在的國家，你可以有一個他們在不同國家講什麼語言的數據庫。我曾經使用過geonames數據庫，它運行良好。然後，你可以用你想說的文字和語言呼叫espeak。 Geonames每天提供dump，您可以下載並提取語言。然後，您可以將大量數據庫存儲在服務器上，如Dotcloud。或者，您可以使用它們的API，但每天限制爲30,000次使用。

如果您不知道該街道所在的國家/地區的語言，那麼您可以選擇更粗略的方法，但這並不總是奏效。語言檢測。由於大部分街道名稱在不同國家都是真實的詞彙，例如'Main Street'，你可以運行語言檢測，並找出使用這種方式的語言。我聽說detectlanguage.com對此很有幫助。

所以，雖然沒有現有的方法，你可以自己做一個，沒有太多的麻煩。

來源

2012-05-22 01:24:35 Xyene

他們真的需要記錄整個單詞嗎？我認爲他們會「只是」需要記錄音素。 –

通用文本到語音語音

回答

相關問題