voice-recognition

2熱度

1回答

我對Microsoft認知服務完全陌生。我想建立一個完全由語音控制的web項目。對於語音控制，我使用的是arytom.js，這是一個非常簡單和優秀的API，適合我的使用。對我來說，對於TTS和STT來說，它工作得很好。我現在想要做的是，我想識別誰在說話並將其與數據庫進行比較。我剛剛發現了微軟開發的Speaker Recognition API。我已經有一個API密鑰，現在我想創建註冊並將記錄的語音

0熱度

2回答

Kindle Fire HD 6上的語音識別器訪問

我正在開發Kindle Fire上使用的增強型通信應用程序。我使用Fire HD 6作爲我的測試設備。我正在Xamarin，C＃工作。我知道設備上有一個語音識別器，因爲麥克風圖標顯示在鍵盤上，我可以使用它來填充搜索窗口。但是，我的類人語音識別器代碼不起作用。我得到「識別器不存在」的錯誤。以下是我正在使用的代碼： public class VoiceRecognition : Activity

0熱度

1回答

如何使用RecognizerIntent強制使用土耳其語？

語音recognation：我使用該代碼來檢測： Intent myintent = new Intent(RecognizerIntent.ACTION_RECOGNIZE_SPEECH); myintent.putExtra(RecognizerIntent.EXTRA_LANGUAGE_MODEL, RecognizerIntent.LANGUAGE_MODEL

3熱度

1回答

如何讓Cortana理解拼寫單詞的發音？

我通過VCD集成了我的應用程序在Cortana，但問題是我的應用程序名稱存儲在標籤「AppName」不是一個字典單詞。它被稱爲「cybrick」，Cortana只是不理解它，並將其稱爲「cibrick」，這是不可接受的。有沒有辦法訓練Cortana如何發音不在詞典中的單詞？也許提供轉錄或語音樣本？

0熱度

1回答

在Python中實現語音激活的密碼實現

我想事先錄製一個詞，並且在python腳本中使用相同的密碼時，如果口述密碼與先前錄製的文件相匹配，程序應運行。我不想使用語音識別工具包，因爲密碼可能不是任何適當的詞，但可能是完整的亂碼。我開始將先前錄製的文件和新演講的聲音保存爲numpy數組。現在我需要一種方法來確定兩個數組是否相互「接近」。有人能爲我指出正確的方向嗎？

0熱度

1回答

ios：如何檢測語音聽寫是否用於UITextView？或在鍵盤上點擊麥克風按鈕

如何檢測語音聽寫是否用於UITextView？或麥克風按鈕在UI的TextView

1熱度

1回答

Javascript實時語音流和處理它在Django的後端

嗨我目前正在從事一個項目，我想流用戶的聲音，實時使用JS，從用戶的角度來看，認爲谷歌的語音識別API演示。到目前爲止，我嘗試了幾個jQuery庫，但他們似乎並沒有像我期望的那樣工作 - 或者沒有與Web瀏覽器兼容，他們無法檢測到麥克風或發送到服務器失敗。最近，我正在探索webrtc，它似乎可以完成這項工作，但我不確定是否有可能從web瀏覽器流向django後端。我不想既不使用node.js也

1熱度

1回答

如何在幾秒鐘沉默後結束SFSpeechRecognitionTask

我正在使用新的Apple Speech庫，並且找不到命令來翻轉isFinal bool，並在沉默幾秒後結束轉錄。有沒有人知道如何在沉默後結束任務？這是接收語音轉錄結果的代碼。 recognitionRequest.shouldReportPartialResults = true speechRecogTask = speechRecognizer.recognitionTask(w

-1熱度

1回答

語音到文本 - Alexa語音服務

我正在嘗試使用Alexa語音服務將語音轉換爲text.A簡單的麥克風和文本框應用程序的Android應用程序。我是新來的android，需要深入的指導才能理解。

0熱度

1回答

sphinx4只識別自定義詞

我正在開發一個在java中使用Sphinx4的程序。我想減少聲學模型和語法，使其非常簡單和簡潔，適合我的使用。我的用法是理解幾個單詞，逐字識別。例如，單詞將是{man，bye，good，yo} 當我說「man」時，我希望程序立即將其識別爲「man」; 程序不應該等待任何其他單詞，一旦程序識別出一個單詞。任何人都可以引導我到文檔或示例/演示，我可以參考創建這樣的事情？這是我寫到目前爲止的代