voice-recognition

0熱度

1回答

我正在使用S8/S8 +。我想從Intent調用bibxy應用程序。但是，我無法稱呼它。我如何從Intent調用它？這是我嘗試 final String SVOICE_PACKAGE_NAME = "com.samsung.voiceserviceplatform"; final Intent intent = new Intent(); intent.setPackage(SVOICE_P

1熱度

1回答

IBM Speech to Text字母數字字符串識別？

在試圖將語音轉換爲文本（IBM語音網關IVR應用程序）以識別字母數字字符串時，我想知道是否可以創建自定義語法或實體來限制STT以識別單個字母和數字，排除單詞共。例如，這是一個典型的字符串：20Y0H8C。沃森回來的話和數字，如「兩」而不是「2」。數字字符串正常工作。我意識到字母識別對於典型的ASR是有問題的，但我希望沃森能夠勝任這項任務。我注意到沒有用於字母數字字符的系統實體。任何建議，非常感謝。

0熱度

1回答

Swift中的聲音

我目前在Swift中製作的應用程序將幫助盲人使用這一綜合解決方案導航世界。我正在尋找一個應用程序的通用函數，當被調用時，它將立即開始錄製，傾聽用戶說出的內容，一旦用戶停止說話，它將自動停止錄製，將錄製內容轉換爲字符串，然後返回它。該功能應該可以在單個視圖控制器中多次使用。我一直在使用從這篇文章的技術嘗試，並沒有奏效：https://medium.com/ios-os-x-development/

0熱度

1回答

從定製數據訓練UBM與sidekit

我想從我已經用SIDEKIT提取的情感識別數據訓練GMM-UBM模型（幾乎與說話人識別一樣，我也不理解HDF5功能文件系統）。我的數據是具有形狀的視頻（1101,78）[78是聲學特徵的數量和1101是特徵矢量（幀）的數量。 UBM = sidekit.Mixture（） llks = ubm.EM_uniform（憤怒，distribNb，iteration_min = 3，iteration_

3熱度

1回答

語音到文本轉換R

有什麼方法可以將用戶語音實時轉換爲文本使用R？只是好奇。如果任何人都可以分享一些關於他們在這個領域所做的事情的例子，這將是非常好的。謝謝。

-3熱度

1回答

用聲音給一個情節賦予一個情節，這有可能嗎？

我會直接指出這一點。我有一個由點表示的3D圖形的情節，我想要做的是給matlab一個語音命令，使一個功能開始。具體而言，我想說的例如「旋轉」，matlab應該識別這個聲音命令，並使圖中的實際圖形旋轉。這是可能的或我應該放棄？因爲我會瘋狂嘗試。在此先感謝。

1熱度

2回答

連續語音識別UWP

我正在創建一個使用UWP的智能鏡像應用程序，我嘗試將應用程序與持續語音識別進行集成，以便用戶可以使用語音來控制它。但是Bing Speech REST API不支持連續的語音識別，所以我可以使用其他任何功能？如果你有源代碼，那會更好。

-4熱度

1回答

Google Assistant SDK或Jasper？

我剛開始在家裏爲自己建立語音助理系統。我有什麼？樹莓派3套件一個體面的藍牙音箱連接我需要什麼？要建立一個正常的溝通語音助理系統，當我搜索可用的SDK的我找到碧玉和谷歌助理。我感到困惑的艇員選拔正確one.Kindly建議

2熱度

1回答

語音識別API「兵」是很慢

我使用下面的代碼使用語音識別在Python import speech_recognition as sr # obtain audio from the microphone r = sr.Recognizer() with sr.Microphone() as source: r.adjust_for_ambient_noise(source) print("Say somethi

0熱度

2回答

新Twilio語音識別（強制字母數字，「非字」輸入？）

我期待建立一個應用程序，根據調用者的特定產品請求獲取產品的庫存信息。所有這些產品都是字母數字，並且不使用任何詞語，這是問題的一部分。在測試呼叫，我請「DBN5009K」在日誌中，你可以看到，它把它理解如下： SpeechResult BBN 5009 okay 我不是尋找一個完美的結果，並計劃清理輸入的空白，然後運行Levenshtein算法來匹配最近的項目。如果結果是B BN5009