2009-07-13 175 views
6

我需要開發一個識別語音的iPhone應用程序,並根據結果執行進一步的任務。iPhone上的語音識別

我知道iPhone 3.0不支持語音識別,我需要在服務器端實現語音識別軟件。我只知道這件事,因爲我是新手,我不知道該如何處理。

意思我需要在服務器端購買和實現它的軟件以及如何使用該服務?

+0

你是什麼意思服務器端? – Shimmy 2009-07-13 09:23:13

+1

他的意思是「不在電話裏」。這可能有助於指定是否需要使用特定的服務器操作系統。 – 2009-07-13 09:36:06

+0

服務器端意味着將音頻數據發送到服務器,識別那裏的語音(使用大量資源和內存)並將生成的文本輸出發送回手機。谷歌在Android上使用OCR和機器翻譯來做到這一點,例如:拍攝一些外文文件,將其發送到服務器,OCR並將其翻譯成英文,並將文本結果發回。 – Frank 2010-04-11 17:14:23

回答

7

我知道的最好的開源語音識別軟件包是Sphinx。
http://cmusphinx.sourceforge.net/

否則,我會建議調查Nuance軟件。

當前的語音識別功能在語法設置有限的情況下表現良好(如果您知道他們將會說些什麼)。開放式聽寫仍然不能很好地適用於許多應用程序。請在開發應用程序時牢記這一點。我希望現在谷歌正在進入轉錄遊戲(使用谷歌語音),這應該開始改善。我想他們將來可能會有一些東西。

1

獲得語音識別的權利是非常棘手和積極的研究領域。

雖然有幾個開源解決方案,但請參見here。另一個新的是SCARF,但我不知道這是否可以使用,或者只是一個概念證明。