speech

    4熱度

    1回答

    什麼是最好的當前支持語音或文本API或SDK移動(多個平臺:Android,iOS設備等) 有特定的幾個職位到iPhone,但我正在尋找一個理想的跨平臺解決方案。 N.B.看起來,所有解決方案最終都會在遠程服務器上發佈REST-ful API,而不是在本地進行語音處理。 (這是真的嗎?)

    2熱度

    1回答

    我需要編寫一個使用語音識別引擎的應用程序。 如何通過c#語音在多個文本框中輸入不同的值? 我可以在單個文本框中輸入值,但不能在第二個文本框中輸入值。我有以下代碼在單個文本框中輸入值。 private SpeechRecognitionEngine rec; private void voice() { rec = new SpeechRecognitionEngine();

    10熱度

    6回答

    我需要將用戶說出的字母識別到設備的麥克風中。該設備可以是Android驅動的移動電話。 例如,當用戶說「[R」就應該給我「R」,而不是「爲」 .. 如何實現在Java這個講信認?我正在尋找可以用代碼輕鬆表達的想法。請建議。 編輯: 基於由@大衛希爾迪奇一個建議,我想出了這個以下人物和他們的冠冕堂皇的話的地圖。 A - ye,a,yay B - be, bee, C - see, sea, D

    1熱度

    1回答

    我有一個程序可以識別語音,所以用戶可以對它進行口授,它會識別這些詞。 我想擴展它以允許用戶說出「計算機,在維基百科上搜索XXXXX」並讓我的程序加載維基百科的搜索頁面,搜索XXXXX。 我該如何做到這一點? 對於實施例 else if (e.Result.Text == "Search on Wikipedia for <string>") { say("Searching for <

    0熱度

    1回答

    我只有一個關於sphinx raw lattice demo的簡單問題(以及所有其他Java文件)。 程序是否掃描了音頻文件並打印出它認爲音頻文件的內容?如果不是,那麼爲什麼它需要將音頻文件加載到Java應用程序中? 預先感謝您:)

    0熱度

    1回答

    我已經GOOGLE了很多次,並與一些關鍵字,但無法找到一個明顯的示例來幫助我。 我有一個縮小的網頁,以刪除按鈕上的文字標籤,因爲屏幕縮小了。我已經包含了「應該」出現在語音輸出中的標題屬性,因此該網站仍然可以訪問,但是我的測試人員告訴我它不起作用。 我需要的是一個屬性或標籤,不會在任何瀏覽器上顯示,但iphone的speak網站功能說的是正確的話。可用性網站建議標題,但它不適用於iphone。

    2熱度

    3回答

    我試圖做一個Android應用程序與語音識別,但不幸的是谷歌不支持我的語言(MACEDONIAN),我試圖比較兩個錄音的聲音。 我使用http://code.google.com/p/musicg/來記錄和比較語音,並且我正在初始化檢測語音的設置。有人可以告訴我如何重寫這個初始化語音檢測功能,這對我來說非常重要。或者其他一些想法 如何做到這一點。 這是哨子檢測初始化 // settings f

    0熱度

    1回答

    英文。我之前使用過pyspeech,但顯然它在windows vista/7中不起作用。我也看到了自然而然的龍。有關我應該嘗試使用什麼庫的建議?

    2熱度

    1回答

    我正在構建一個包含語音識別的應用程序 - 我打算使用Android語音識別服務或語音打字功能。 從我讀過的內容來看,這個演講主要是在雲端處理的。我的問題是,是否有人知道音頻發送到雲端的格式是什麼?例如,是像WAV或MP3或PCM的東西,還是它可能完全是其他東西? 我承認這主要是出於普通的好奇心,要多瞭解一些幕後的情況。 (但部分它也涉及對前後處理對識別的影響的興趣。)

    4熱度

    2回答

    我有一堆關於電話交談的音頻文件。我想嘗試將音頻文件分成兩部分,每部分只包含一個發言者的發言。也許我需要使用語音diarization。但我該怎麼做?任何人都可以給我一些線索?謝謝。 ps:Linux OS.C/C++