speech-to-text

    2熱度

    2回答

    我想實現一個系統,通過Mac OS x上的麥克風接收語音。我知道任意的語音識別幾乎是不可能的,不需要訓練系統,所以我願意將它限制爲10個簡單的句子。它必須高度準確地識別出這10個句子中的哪一個正在說出,生成文本並向遠程MySQL數據庫添加條目。 由於這些是我想要實現的系統的架構,任何人都可以給我一個關於實現這個系統的最佳方式的概述嗎?我正在尋找像開源庫這樣的想法來最小化編碼,因爲這只是一個演示的原

    1熱度

    2回答

    我正在嘗試安裝語音識別引擎服務器端。 (非商業的首選,因爲它只是一個試驗) 的想法是允許用戶說,從網站的東西那麼無論他/她說會顯示在屏幕上(如文本) 我已經閱讀許多可用軟件,包括Microsoft Speech,Sphinx,Julius等,但不知道哪一個軟件可以執行最好的安裝。 另外,通常我還需要在我的主機上擁有root權限才能執行此類操作?我現在正在使用常規的共享主機。 謝謝 三通

    6熱度

    3回答

    我從小就有嚴重到嚴重的耳聾,但幸運的是,我可以像普通人一樣說話。口頭溝通對我來說一直都很困難,因爲即使在脣讀時我的語音識別能力也受損。我通過閱讀董事會,PPT幻燈片,書籍和互聯網瞭解了學校和大學。我在當前的軟件工程方面做得很好,但最近我覺得我必須付出一些努力來改善我的狀況。 字幕是我在這個國家的救星來了解電影/電視上播放,我只是一直在享受這個在過去7年(我31了)。 我強烈地感到,是要看在現實生活

    5熱度

    3回答

    有誰知道如何從.NET應用程序中更改識別配置文件? 我寫一個.NET應用程序,做使用在System.Speech.Recognition命名空間中找到該功能的語音識別。我饋入系統的音頻來自多個不同的用戶。我希望能夠訓練系統以更準確地識別來自每個不同用戶的語音。 我已經在windows(本例中爲Windows 7)中找到語音識別控制面板,我可以在其中配置訓練配置文件。爲自己設置配置文件並執行培訓過程

    0熱度

    1回答

    如何在輸入語音被識別之前獲取輸入語音。例如,如果我說「hel」,並且它在字典中找不到它,或者它認爲它是另一個詞,則爲 。 我只想得到「hel」

    1熱度

    1回答

    夥計們, 我想放在一起,我使用微軟的SAPI到服務器端系統: 在服務器中執行多個同步聽寫風格的認可。 此外,所有認可可以使用不同的揚聲器配置文件(我的應用程序將識別用戶並向SAPI指示要加載的配置文件)。 我也想通過編程來訓練各種用戶配置文件。 我已經知道以上的一些不可能從託管代碼,即System.speech命名空間。任何人都可以啓發我,我是否試圖在理論上使用SAPI 5.x做些什麼? 感謝您的

    7熱度

    2回答

    是否有任何軟件能夠獲取音頻文件並輸出音韻(IPA)文本? 我明白大部分的軟件都是直接使用語言,但是有一種「可教」的嗎?

    1熱度

    4回答

    我想建立一個應用程序,當用戶在iPhone上談論某件事物時,它會將其轉換爲相應的文本。 我聽說在Windows平臺上它是可能的。 Wheather這可能在iPhone?任何可用的API?

    4熱度

    4回答

    有什麼方法可以讓我們用iPhone SDK將語音轉換爲文字?

    0熱度

    1回答

    我是僅用於內部數據輸入的.Net 3.5 WinForm應用程序。主要是各種形式的文本框等。對於Windows 7語音識別,它似乎就像它適用於我的「開箱即用」。 我想知道的是,如果那是完全正確的。我需要採取哪些步驟來確保我的應用程序具有最高級別的可用性?它是否使用UI元素或其他東西的標籤? 我需要inclued的System.Speech.Recognition Namespace談到here 任