speech

4熱度

1回答

什麼是最好的當前支持語音或文本API或SDK移動（多個平臺：Android，iOS設備等）有特定的幾個職位到iPhone，但我正在尋找一個理想的跨平臺解決方案。 N.B.看起來，所有解決方案最終都會在遠程服務器上發佈REST-ful API，而不是在本地進行語音處理。（這是真的嗎？）

2熱度

1回答

如何通過C＃語音在多個文本框中輸入不同的值

我需要編寫一個使用語音識別引擎的應用程序。如何通過c＃語音在多個文本框中輸入不同的值？我可以在單個文本框中輸入值，但不能在第二個文本框中輸入值。我有以下代碼在單個文本框中輸入值。 private SpeechRecognitionEngine rec; private void voice() { rec = new SpeechRecognitionEngine();

10熱度

6回答

識別使用java的人所說的字母

我需要將用戶說出的字母識別到設備的麥克風中。該設備可以是Android驅動的移動電話。例如，當用戶說「[R」就應該給我「R」，而不是「爲」 .. 如何實現在Java這個講信認？我正在尋找可以用代碼輕鬆表達的想法。請建議。編輯：基於由@大衛希爾迪奇一個建議，我想出了這個以下人物和他們的冠冕堂皇的話的地圖。 A - ye,a,yay B - be, bee, C - see, sea, D

1熱度

1回答

識別口語句子中的關鍵詞

我有一個程序可以識別語音，所以用戶可以對它進行口授，它會識別這些詞。我想擴展它以允許用戶說出「計算機，在維基百科上搜索XXXXX」並讓我的程序加載維基百科的搜索頁面，搜索XXXXX。我該如何做到這一點？對於實施例 else if (e.Result.Text == "Search on Wikipedia for <string>") { say("Searching for <

0熱度

1回答

sphinx4 raw Lattice demo

我只有一個關於sphinx raw lattice demo的簡單問題（以及所有其他Java文件）。程序是否掃描了音頻文件並打印出它認爲音頻文件的內容？如果不是，那麼爲什麼它需要將音頻文件加載到Java應用程序中？預先感謝您:)

0熱度

1回答

iphone語音輸出來自html

我已經GOOGLE了很多次，並與一些關鍵字，但無法找到一個明顯的示例來幫助我。我有一個縮小的網頁，以刪除按鈕上的文字標籤，因爲屏幕縮小了。我已經包含了「應該」出現在語音輸出中的標題屬性，因此該網站仍然可以訪問，但是我的測試人員告訴我它不起作用。我需要的是一個屬性或標籤，不會在任何瀏覽器上顯示，但iphone的speak網站功能說的是正確的話。可用性網站建議標題，但它不適用於iphone。

2熱度

3回答

語音識別和聲音比較與音樂g

我試圖做一個Android應用程序與語音識別，但不幸的是谷歌不支持我的語言（MACEDONIAN），我試圖比較兩個錄音的聲音。我使用http://code.google.com/p/musicg/來記錄和比較語音，並且我正在初始化檢測語音的設置。有人可以告訴我如何重寫這個初始化語音檢測功能，這對我來說非常重要。或者其他一些想法如何做到這一點。這是哨子檢測初始化 // settings f

0熱度

1回答

什麼是可用於python的最先進的語音識別庫？

英文。我之前使用過pyspeech，但顯然它在windows vista/7中不起作用。我也看到了自然而然的龍。有關我應該嘗試使用什麼庫的建議？

2熱度

1回答

使用Android語音識別語音發送到雲的格式是什麼？

我正在構建一個包含語音識別的應用程序 - 我打算使用Android語音識別服務或語音打字功能。從我讀過的內容來看，這個演講主要是在雲端處理的。我的問題是，是否有人知道音頻發送到雲端的格式是什麼？例如，是像WAV或MP3或PCM的東西，還是它可能完全是其他東西？我承認這主要是出於普通的好奇心，要多瞭解一些幕後的情況。（但部分它也涉及對前後處理對識別的影響的興趣。）

4熱度

2回答

如何分離基於不同揚聲器的音頻文件

我有一堆關於電話交談的音頻文件。我想嘗試將音頻文件分成兩部分，每部分只包含一個發言者的發言。也許我需要使用語音diarization。但我該怎麼做？任何人都可以給我一些線索？謝謝。 ps：Linux OS.C/C++