voice-recognition

    0熱度

    1回答

    我正在使用S8/S8 +。我想從Intent調用bibxy應用程序。但是,我無法稱呼它。我如何從Intent調用它? 這是我嘗試 final String SVOICE_PACKAGE_NAME = "com.samsung.voiceserviceplatform"; final Intent intent = new Intent(); intent.setPackage(SVOICE_P

    1熱度

    1回答

    在試圖將語音轉換爲文本(IBM語音網關IVR應用程序)以識別字母數字字符串時,我想知道是否可以創建自定義語法或實體來限制STT以識別單個字母和數字,排除單詞共。例如,這是一個典型的字符串:20Y0H8C。沃森回來的話和數字,如「兩」而不是「2」。數字字符串正常工作。我意識到字母識別對於典型的ASR是有問題的,但我希望沃森能夠勝任這項任務。我注意到沒有用於字母數字字符的系統實體。任何建議,非常感謝。

    0熱度

    1回答

    我目前在Swift中製作的應用程序將幫助盲人使用這一綜合解決方案導航世界。我正在尋找一個應用程序的通用函數,當被調用時,它將立即開始錄製,傾聽用戶說出的內容,一旦用戶停止說話,它將自動停止錄製,將錄製內容轉換爲字符串,然後返回它。該功能應該可以在單個視圖控制器中多次使用。 我一直在使用從這篇文章的技術嘗試,並沒有奏效:https://medium.com/ios-os-x-development/

    0熱度

    1回答

    我想從我已經用SIDEKIT提取的情感識別數據訓練GMM-UBM模型(幾乎與說話人識別一樣,我也不理解HDF5功能文件系統)。我的數據是具有形狀的視頻(1101,78)[78是聲學特徵的數量和1101是特徵矢量(幀)的數量。 UBM = sidekit.Mixture() llks = ubm.EM_uniform(憤怒,distribNb,iteration_min = 3,iteration_

    3熱度

    1回答

    有什麼方法可以將用戶語音實時轉換爲文本使用R?只是好奇。如果任何人都可以分享一些關於他們在這個領域所做的事情的例子,這將是非常好的。謝謝。

    -3熱度

    1回答

    我會直接指出這一點。 我有一個由點表示的3D圖形的情節,我想要做的是給matlab一個語音命令,使一個功能開始。 具體而言,我想說的例如「旋轉」,matlab應該識別這個聲音命令,並使圖中的實際圖形旋轉。 這是可能的或我應該放棄?因爲我會瘋狂嘗試。 在此先感謝。

    1熱度

    2回答

    我正在創建一個使用UWP的智能鏡像應用程序,我嘗試將應用程序與持續語音識別進行集成,以便用戶可以使用語音來控制它。但是Bing Speech REST API不支持連續的語音識別,所以我可以使用其他任何功能?如果你有源代碼,那會更好。

    -4熱度

    1回答

    我剛開始在家裏爲自己建立語音助理系統。 我有什麼? 樹莓派3套件 一個體面的藍牙音箱連接 我需要什麼? 要建立一個正常的溝通語音助理系統,當我搜索可用的SDK的我找到碧玉和谷歌助理。 我感到困惑的艇員選拔正確one.Kindly建議

    2熱度

    1回答

    我使用下面的代碼使用語音識別在Python import speech_recognition as sr # obtain audio from the microphone r = sr.Recognizer() with sr.Microphone() as source: r.adjust_for_ambient_noise(source) print("Say somethi

    0熱度

    2回答

    我期待建立一個應用程序,根據調用者的特定產品請求獲取產品的庫存信息。所有這些產品都是字母數字,並且不使用任何詞語,這是問題的一部分。 在測試呼叫,我請「DBN5009K」 在日誌中,你可以看到,它把它理解如下: SpeechResult BBN 5009 okay 我不是尋找一個完美的結果,並計劃清理輸入的空白​​,然後運行Levenshtein算法來匹配最近的項目。如果結果是B BN5009