voice-recognition

    1熱度

    1回答

    我有幾個小時的講座,其中有連續的口譯發生。 (我的意思是幾個,這是一個巨大的數據庫)。連續的解釋意味着講師講了一點,然後,在他停頓之後,翻譯人員將他剛纔對觀衆所說的內容進行了翻譯。 講師用英語說話,然後口譯員翻譯成當地語言(他在全球發表講話,所以「當地語言」可以是任何東西)。 我被指責的任務是從音頻中刪除翻譯的聲音,只留下講師。 我需要一些關於實現此目標的最簡單方法的指導。我想這是一個非常簡單的任

    0熱度

    1回答

    我在我的Android應用程序中使用Pocketsphinx。我有一個比較小的命令集獨立的認可,所以我結束了使用來自看起來像這樣一個文件的關鍵字搜索: one/1.0/ done/1.0/ recognition on/1e-10/ recognition off/1e-10/ 實際列表不是英語,所以這些關鍵字是任意的選擇這個例子的緣故。我意識到這些閾值可能不如最優,而且這些短語容易出現

    2熱度

    2回答

    我進口這個項目: https://github.com/cmusphinx/pocketsphinx-android-demo 並能正常工作在Android工作室。 但正如你可以在教程中看到它有英文語音識別。我怎樣才能把它變成土耳其語?我搜查了很多,但我無法找到它。 在此先感謝。

    1熱度

    1回答

    我一直在使用Pocketsphinx Android演示,並得到錯誤:「無法初始化識別器java.io.IOException:無法初始化記錄器,麥克風可能已經在使用中。 錯誤是什麼意思,我該怎麼辦才能修復它?

    0熱度

    1回答

    我正在使用簡單的語音識別。 我知道它成功地工作。 可以說我講「備註嘿,這是堆棧溢出」 我要排除「備註」,並打印文本的休息一個TextView。 以下是我的工作onActivityResult: - protected void onActivityResult(int requestCode, int resultCode, Intent data) { if (requestCode

    0熱度

    1回答

    是否有任何操作可用於收聽音頻,以便當我說我的預設詞「早上好」時,它應該啓動我的應用程序。這意味着我想用一個定義爲「聽音頻」的動作製作廣播接收器,就像任何人說「Ok google」中的「早上好」一樣,我的接收器應該聽取並執行我的任務。 請幫助我,這將是偉大的。 預先感謝您。

    2熱度

    1回答

    我正在使用烏爾都語(在巴基斯坦,印度,孟加拉國語言中使用的語言)將語音識別轉換爲烏爾都語的語音。到目前爲止,我什麼也沒做,但只是找到了meyda JavaScript庫從數據框中提取mfccs。一些文件說,對於ASR來說,需要12個或13個mfccs中的26個。在測試期間,我在wav擴展名的文件夾中有46個音素(/ b /,/ g /,/ d/...)。在其中一個音素上運行meyda進程後,它會爲

    1熱度

    1回答

    目前我正在研究MATLAB中的語音識別項目。 我已經拍攝了兩個聲音信號,並提取了相同的MFCC係數。 據我所知,我現在應該計算兩者之間的歐幾里德距離,然後應用DTW算法。這就是爲什麼我計算了兩者之間的距離,並得到了一系列距離。 所以我的問題是如何在結果數組上實現DTW? 這裏是我的MATLAB代碼: 清除所有;關閉所有; CLC; % Define variables Tw = 25; %

    0熱度

    1回答

    我想創建一個可以識別用戶語音並驗證用戶的Android應用程序,任何人都可以幫助我找到任何庫代碼或算法嗎? 在此先感謝

    -1熱度

    1回答

    最近我正在進行一個大學項目,但我想對登錄進行一些添加,並且正如標題所述,添加語音識別,可以驗證語音是否幾乎是相同?如果可以做到,那麼最好的選擇是什麼?