14

有桌面或瀏覽器環境的已知API的全面列表嗎?文本到語音(語音生成)和語音到文本(語音識別)API?

+0

這是一個非常廣泛的問題。你對API或實現感興趣嗎?是否有任何語言或平臺選擇可以限制這一點? – 2011-06-14 22:40:17

+0

我知道確實很少有好的解決方案,所以我決定選擇平臺(廣義上)和編程語言,這些語言基於良好的文本到語音和語音到文本的可用性。 – Halst 2011-06-15 09:21:16

回答

29

我會重試並更新Speech recognition in C or Java or PHP?的答案。這絕不是全面的,但它可能是一個開始你


從看這些問題的幾個月裏,我見過最開發商選擇打破這樣的:

Windows操作系統的用戶 - 使用.Net或Microsoft.Speech的System.Speech功能,並安裝Microsoft提供的免費識別器。 Windows 7包含一個完整的語音引擎。其他人可免費下載。有一個C++ API與SAPI相同的引擎。請參閱http://msdn.microsoft.com/en-us/magazine/cc163663.aspx。或http://msdn.microsoft.com/en-us/library/ms723627(v=vs.85).aspx。 Windows微軟引擎的更多背景 What is the difference between System.Speech.Recognition and Microsoft.Speech.Recognition?

Linux人 - 獅身人面像似乎有一個良好的關注。見http://cmusphinx.sourceforge.net/http://cmusphinx.sourceforge.net/wiki/

商業產品 - NuanceLoquendoAT&TIBM,等等。每個提供各自語言的SDK和庫。

在線服務 - NuanceYapmeispeech.orgvlingo,其他。 Nuance已經改進了他們的開發人員計劃,現在將爲您提供free access to their services的開發。 Yap(我相信)最近是purchased by Amazon,所以我們可能會在那裏看到一些變化。

當然,這也可能是有益的 - http://en.wikipedia.org/wiki/List_of_speech_recognition_software

有一個Java語音API。請參閱Java Speech API http://java.sun.com/products/java-media/speech/forDevelopers/jsapi-guide/Recognition.html中的javax.speech.recognition。我相信你仍然需要找到一個支持這個API的語音引擎。我不認爲獅身人面像完全支持它 - http://cmusphinx.sourceforge.net/sphinx4/doc/Sphinx4-faq.html#support_jsapi

還有很多其他SO quesitons的: Need text to speech and speech recognition tools for Linuxpyspeech (python) - Transcribe mp3 files?其中談到http://code.google.com/p/pyspeech/。您可能還想看看​​

+1

您錯過的另一種非官方在線服務是Google的Speech API。這裏是一個Java中的一些API鉤子的鏈接:https://github.com/The-Shadow/java-speech-api – Skylion 2014-02-01 19:19:46

+2

我不相信谷歌曾經公開他們的語音API。人們已經反向設計並使用它,但我不相信谷歌支持第三方使用它。我相信它只能用於Chrome瀏覽器或Android操作系統。請參閱http://stackoverflow.com/a/12727910/90236或http://stackoverflow.com/a/7889565/90236 – 2014-02-02 23:30:01

+0

Google的API可在Chrome上免費訪問。我的網頁應用程序執行它:https://speechlogger.appspot.com – 2015-05-07 21:59:01

2

文本到語音(語音生成)的領先API供應商是YAKiToMe!和iSpeech。 YAKiToMe!是我使用的,因爲我喜歡他們的語音質量最好,他們是最便宜的(大部分是免費的)。他們支持多種語言的男性和女性演講者。一些聲音供應商,如Acapella,Nuance,Loquendo和iVona都有不錯的聲音,但使用起來往往很昂貴。

1

以下是您可以做到的方式: 注意:這是一個來自google的api,所以它只能在Chrome瀏覽器中運行。

(見現場演示,請下載完整的源代碼http://purpledesign.in/blog/?p=33

定義按鈕

<input id="speech" type="text" speech="speech" x-webkit-speech="x-webkit-speech" onspeechchange="processspeech();" onwebkitspeechchange="processspeech();" /> 

和定義你想要做什麼功能的JavaScript文件

喜歡這個

function processspeech() 
    { 
    var speechtext=$("#speech").val(); 
    var elem = document.getElementById("test"); 
    elem.value = speechtext; 
    var notification="\"<span style=\"color:#F00; text-transform:uppercase;\">"+ speechtext + "</span>\" <br />*Is this what you said???"; 
    notify(notification); 
} 

這裏

<textarea> id="test"></textarea> 

語音寫在textarea的

+1

鏈接指向一個空的託管頁面。 – 2015-05-07 21:57:09