voice-recognition

    2熱度

    1回答

    我對Microsoft認知服務完全陌生。我想建立一個完全由語音控制的web項目。對於語音控制,我使用的是arytom.js,這是一個非常簡單和優秀的API,適合我的使用。對我來說,對於TTS和STT來說,它工作得很好。我現在想要做的是,我想識別誰在說話並將其與數據庫進行比較。我剛剛發現了微軟開發的Speaker Recognition API。我已經有一個API密鑰,現在我想創建註冊並將記錄的語音

    0熱度

    2回答

    我正在開發Kindle Fire上使用的增強型通信應用程序。我使用Fire HD 6作爲我的測試設備。我正在Xamarin,C#工作。 我知道設備上有一個語音識別器,因爲麥克風圖標顯示在鍵盤上,我可以使用它來填充搜索窗口。但是,我的類人語音識別器代碼不起作用。我得到「識別器不存在」的錯誤。以下是我正在使用的代碼: public class VoiceRecognition : Activity

    0熱度

    1回答

    語音recognation: 我使用該代碼來檢測: Intent myintent = new Intent(RecognizerIntent.ACTION_RECOGNIZE_SPEECH); myintent.putExtra(RecognizerIntent.EXTRA_LANGUAGE_MODEL, RecognizerIntent.LANGUAGE_MODEL

    3熱度

    1回答

    我通過VCD集成了我的應用程序在Cortana,但問題是我的應用程序名稱存儲在標籤「AppName」不是一個字典單詞。它被稱爲「cybrick」,Cortana只是不理解它,並將其稱爲「cibrick」,這是不可接受的。有沒有辦法訓練Cortana如何發音不在詞典中的單詞?也許提供轉錄或語音樣本?

    0熱度

    1回答

    我想事先錄製一個詞,並且在python腳本中使用相同的密碼時,如果口述密碼與先前錄製的文件相匹配,程序應運行。我不想使用語音識別工具包,因爲密碼可能不是任何適當的詞,但可能是完整的亂碼。我開始將先前錄製的文件和新演講的聲音保存爲numpy數組。現在我需要一種方法來確定兩個數組是否相互「接近」。有人能爲我指出正確的方向嗎?

    0熱度

    1回答

    如何檢測語音聽寫是否用於UITextView?或麥克風按鈕在UI的TextView

    1熱度

    1回答

    嗨我目前正在從事一個項目,我想流用戶的聲音,實時使用JS,從用戶的角度來看,認爲谷歌的語音識別API演示。 到目前爲止,我嘗試了幾個jQuery庫,但他們似乎並沒有像我期望的那樣工作 - 或者沒有與Web瀏覽器兼容,他們無法檢測到麥克風或發送到服務器失敗。 最近,我正在探索webrtc,它似乎可以完成這項工作,但我不確定是否有可能從web瀏覽器流向django後端。 我不想既不使用node.js也

    1熱度

    1回答

    我正在使用新的Apple Speech庫,並且找不到命令來翻轉isFinal bool,並在沉默幾秒後結束轉錄。有沒有人知道如何在沉默後結束任務? 這是接收語音轉錄結果的代碼。 recognitionRequest.shouldReportPartialResults = true speechRecogTask = speechRecognizer.recognitionTask(w

    -1熱度

    1回答

    我正在嘗試使用Alexa語音服務將語音轉換爲text.A簡單的麥克風和文本框應用程序的Android應用程序。 我是新來的android,需要深入的指導才能理解。

    0熱度

    1回答

    我正在開發一個在java中使用Sphinx4的程序。 我想減少聲學模型和語法,使其非常簡單和簡潔,適合我的使用。 我的用法是理解幾個單詞,逐字識別。 例如,單詞將是{man,bye,good,yo} 當我說「man」時,我希望程序立即將其識別爲「man」; 程序不應該等待任何其他單詞,一旦程序識別出一個單詞。 任何人都可以引導我到文檔或示例/演示,我可以參考創建這樣的事情? 這是我寫到目前爲止的代