我需要開發一個識別語音的iPhone應用程序,並根據結果執行進一步的任務。iPhone上的語音識別
我知道iPhone 3.0不支持語音識別,我需要在服務器端實現語音識別軟件。我只知道這件事,因爲我是新手,我不知道該如何處理。
意思我需要在服務器端購買和實現它的軟件以及如何使用該服務?
我需要開發一個識別語音的iPhone應用程序,並根據結果執行進一步的任務。iPhone上的語音識別
我知道iPhone 3.0不支持語音識別,我需要在服務器端實現語音識別軟件。我只知道這件事,因爲我是新手,我不知道該如何處理。
意思我需要在服務器端購買和實現它的軟件以及如何使用該服務?
我不認爲有很多服務器端語音識別軟件套件。開源版本似乎幾乎不存在。你可能想看看這個SDK雖然:
http://www.scribd.com/doc/17247334/Creaceed-Releases-iPhone-Speech-Recognition-SDK http://www.creaceed.com/weblog/ceedvocalsdk.html
它可能讓你做你想要在iPhone本身是什麼。
我知道的最好的開源語音識別軟件包是Sphinx。
http://cmusphinx.sourceforge.net/
否則,我會建議調查Nuance軟件。
當前的語音識別功能在語法設置有限的情況下表現良好(如果您知道他們將會說些什麼)。開放式聽寫仍然不能很好地適用於許多應用程序。請在開發應用程序時牢記這一點。我希望現在谷歌正在進入轉錄遊戲(使用谷歌語音),這應該開始改善。我想他們將來可能會有一些東西。
查看Nuance Mobile Developer program。我們有各種平臺(包括iOS)的庫和必要的HTTP服務。
你是什麼意思服務器端? – Shimmy 2009-07-13 09:23:13
他的意思是「不在電話裏」。這可能有助於指定是否需要使用特定的服務器操作系統。 – 2009-07-13 09:36:06
服務器端意味着將音頻數據發送到服務器,識別那裏的語音(使用大量資源和內存)並將生成的文本輸出發送回手機。谷歌在Android上使用OCR和機器翻譯來做到這一點,例如:拍攝一些外文文件,將其發送到服務器,OCR並將其翻譯成英文,並將文本結果發回。 – Frank 2010-04-11 17:14:23