speech-recognition

    0熱度

    1回答

    我正在使用this link來構建語音識別器。運行後,我可以看到,在200個曆元後,訓練標籤錯誤率從1.023下降到0.085,但驗證標籤錯誤率僅從1.347下降到0.843。稍後,驗證標籤錯誤率不會再降低。 任何人都可以建議網絡結構的任何變化或超參數的變化,以提高驗證標籤錯誤率嗎?

    0熱度

    1回答

    我想添加一些關鍵字到我的應用程序,所以API可以更有效地識別說出的話。例如,I m having trouble recognizing the some Italian words that starts with E,(例如,每個我)。或用德語(呃)。 這裏是我的代碼: public void recognize (int sampleRate) { if (mApi == null

    0熱度

    1回答

    目前我嘗試對我的UWP應用程序實現語音識別功能,到目前爲止,我創建了一個連續的聽寫功能來識別用戶的語音,但我希望它只是識別單詞或階段那在語法文件中如何爲它創建和添加語法? 這是我連續識別碼: protected async override void OnNavigatedTo(NavigationEventArgs e) { CoreDispatcher dispatcher = C

    0熱度

    1回答

    我正在使用Windows.Speech API 我想要做的是讓系統識別短語的一部分,而不是尋找整個事情。 例如,如果我加載字符串:「你好嗎」,它要求用戶準確地說,你好嗎。最終,我希望Windows.Speech也能認識到這樣的事情:「嘿,今天好嗎?」 這是我目前有: //This is used for Building the recognizer engine. Choices comman

    1熱度

    1回答

    我目前試圖提取的目標值對齊到波形圖表。 提取的目標值是確定發音單詞是否是(是,否,沉默)的音素類。 我一直在試圖正確地與波形對準目標的值,但目標類關係的偏離在某種程度上結束了,並在那裏上的波形它被放置。 例子: 該圖顯示了句「是否否否否是」說出了波形。 類標籤是如下 沉默:0 是:1 無:2 前四個0有意義(用紅色標出),因爲沒有能量在波形看出因此它必須是沉默。但是第五個0(用綠色標記)沒有意義。

    -1熱度

    1回答

    該程序不完整,但是正在進行中。 import speech_recognition as sr import subprocess as sp import time, os r = sr.Recognizer() print("Voice Recognition Software\n\n***************************************************

    0熱度

    1回答

    我在網頁中使用了SpeechRecognition API。我想在用戶說話時展示一個可視化。例如,我希望能夠顯示一些像these的酒吧。當我查看該示例中顯示的代碼時,似乎需要使用AudioContext API。我的挑戰是我看不到如何將SpeechRecognition API連接到AudioContext API。有沒有辦法做到這一點? 我知道這是實驗技術。我只是假設我可以使用麥克風作爲音頻上下

    0熱度

    1回答

    我想線程一個speech_recognition函數在後臺連續運行,並檢查音頻函數,看看有什麼文字說話,並採取相應的行動,我試着線程2功能運行平行但語音偵察功能一遍又一遍地被調用,我從來沒有使用線程,並在YouTube上跟隨一個教程來線程我的功能,我得到,我可以犯了一個非常愚蠢的錯誤,所以我請求誰回答這個問題在他們的答案和我的錯誤中有點詳細。謝謝。 編輯 所以我刪除其造成這個錯誤使得整個程序冗餘我

    -1熱度

    1回答

    我正在撰寫關於語音識別的論文,以便從視頻本身生成字幕。這個概念是我打算製作一個視頻播放器,並將語音識別集成到其中。因此,如果我運行系統並播放視頻,直到視頻文件結束,系統將生成該視頻文件的另一個副本,但是這次,字幕已經包含或集成在該視頻文件中。這個概念可能嗎?如果是這樣,你能告訴我我該怎麼做,或者告訴我什麼是最好的SR API或者一些什麼東西?我熟悉java btw。

    0熱度

    1回答

    基本上,我希望我的應用能夠語音激活 如果用戶要求我的應用打開,那麼應該打開 如果用戶說了必須是輸入文本框 如果用戶說要點擊一個按鈕,必須完成 如果用戶想要讀取語音,那麼它應該讀出它。 基本上,我想有時候如果可能讀取用戶命令的應用程序,併爲我的用戶羣最好 沒有太多的可用文檔有,,,所以我想提出的問題在這裏