2011-07-21 75 views
3

我使用了需要字典的Openears。當我們在字典中提到這個詞時它是有用的。我想轉換我們說的所有單詞。所以我用Nuance的演講來認可dragaon SDK。但它與網絡服務器通信。由於安全問題,我想避免服務器通信。是否有可能將語音轉換爲文本,因爲它是在Windows Mobile中,而不是僅在離線模式下與服務器進行通信?iPhone中沒有互聯網的大詞彙量語音識別?

回答

3

無限詞彙表的語音識別需要非常大的計算和內存資源(千兆字節的內存),因此在其他嵌入式設備上的iPhone中很難做到這一點。 iPhone比桌面慢9倍。 iPad比較容易,因爲它具有更強大的CPU。

谷歌已經付出了很大的努力,使他們的引擎脫機聽寫,並且仍然傾向於將數據發送到服務器,因爲它顯着更準確。

因爲大多數在小設備上運行的解決方案都使用有限的詞彙表。雖然這個詞彙可能足夠大,所以你不會注意到這一點。通常500-1000字足以覆蓋大多數實際情況。你可以使用OpenEars來識別這些詞彙。

要訓練語言模型,您需要從您的域(單詞和表達式)文本。在CMUSphinx tutorial中描述了語言模型培訓。要使用的語言模型,你可以使用下面的OpenEars API調用:

- (void) changeLanguageModelToFile:  (NSString *) languageModelPathAsString 
withDictionary:  (NSString *) dictionaryPathAsString 

詳情請參閱API reference

您可以使用OpenEars這樣的詞彙表和相應的語言模型來支持設備的自由格式文本輸入。

+0

還相關http://stackoverflow.com/questions/25949295/cmusphinx-pocketsphinx-recognize-all-or-large-amount-of-english-words –

1

它可以做到,但如果你正在尋找一個無限的詞彙語音轉換器,那麼最好是如果計算是在服務器上完成的。對於像智能手機這樣的系統來說,這樣一個系統的要求可能太大了。您將有巨大需求的主要區域如下:

  1. 詞典將輸入語音映射到文本。
  2. 計算語音識別算法運行。

我相信這就是爲什麼像谷歌這樣的公司在服務器上運行語音識別服務而不是在電話上運行的原因。

但是,如果應用程序是一個有限的文字語音,那麼它可能值得一試。

一切順利!

+0

有沒有在使用離線模式AppStore的任何應用程序?doesvgoogle搜索iPhone應用程序與服務器進行通信? –

+0

是的。每個智能手機上的谷歌語音搜索應用程序都與服務器通信。我對應用程序商店並不熟悉,也沒有聽說過任何可以在手機上進行任何操作的應用程序。但不要聽我的話。你應該對此做一點研究。 – Sriram

0

是不是pocketsphinx在沒有網絡連接的iPhone上工作?是不是有一些演示應用程序像VocalKit

http://www.rajeevan.co.uk/pocketsphinx_in_iphone/可能會有所幫助。

+0

levy,pocketsphinx需要字典,我們不得不在字典中提及編碼這個詞,它會在沒有字典的情況下工作嗎? –

+0

對不起,我關注的是你的「無網絡」部分問題,而不是「無字典」。 –

-3

最佳答案

https://bitbucket.org/sfoster/iphone-tts/src

你可以改變速度間距everythng

+1

這不是OP所要求的完全相反嗎? OP要求爲文本解決方案發表演講。上述鏈接指的是文本到語音的解決方案。我認爲兩者是不同的。 – Sriram