speech-recognition

    0熱度

    1回答

    我試圖SpeechRecognition package與兵ASR服務抄寫the audio of this clip與腳本 #!/usr/bin/env python3 """Recognize speech using Microsoft Bing Voice Recognition.""" import speech_recognition as sr from os impor

    0熱度

    1回答

    我在運行Linux LTS 14.04的外部服務器上託管了Node.js,Google應用上的操作。我注意到,當直接使用Google Home(不是用我的應用程序)時,我可以通過說「stop」來打斷來自合成語音的長篇發音。但是,我的應用程序不起作用。我不得不說「嘿谷歌,停止」,而不是。顯然,即使在我的應用運行時,Google Home設備上的「主機軟件」仍會查找激活短語。 我有活動登錄功能,所以我

    0熱度

    2回答

    我正在使用GoogleSpeechRecongnization API在我的項目中使用Speech To Text。 我已經從sample of Google for Speech To Text Api複製了所有必需的文件並安裝了pod。還從示例代碼中複製了這2個文件AudioController,SpeechRecognitionService以實現該功能。 現在當我編譯我的代碼時,我收到錯誤

    1熱度

    2回答

    我有一個使用在谷歌客戶端Javascript庫動作的谷歌主頁的應用程序: https://github.com/actions-on-google/actions-on-google-nodejs 語音識別是非常好。但有時候我遇到了一個認識上下文,它有一點點麻煩。有沒有什麼辦法可以告訴語音識別設施在每個用戶交互的基礎上強調某些詞語短語的概率?例如,如果用戶被要求提供日期,那麼今年的幾個月的可能性會

    0熱度

    1回答

    我的項目是使用麥克風進行說話人識別。 我正在使用speeh_recognition庫來提取我的麥克風音頻,但對象的類是'speech_recognition.AudioData',我不知道如何將其轉換爲wav文件(爲了使用librosa爲例然後獲取音頻功能,也許可以識別揚聲器)。 有人能幫我嗎?我一直在學習Python,所以可能還有更簡單的方法來使用麥克風進行揚聲器識別:) 非常感謝!

    0熱度

    1回答

    我正在開發一個應用程序,該應用程序使用內置於SpeechRecognizer和RecognizerIntent中的android語音識別功能。是否有任何降噪或噪聲消除庫的Android可以集成到我的應用程序,以提高語音識別的準確性?我在android中看到了NoiseSuppressor類,但我知道如何將它集成到SpeechRecognizer中。我是android編程領域的新手。在此先感謝 pu

    0熱度

    1回答

    我是CMUSphinx4中的乞丐。 我需要比較兩個語音識別樣本。 第一個是美國英語原生的樣本(模式)。 第二個是來自另一種語言的人的樣本。 如何評估兩者的識別? 在此先感謝!

    0熱度

    1回答

    我正在嘗試使用口袋裏的獅身人面像轉錄音頻文件。 pocketsphinx_continuous -infile 116-288045-0005.flac.wav ,但我得到的錯誤: ERROR: "continuous.c", line 136: Input audio file has sample rate [44100], but decoder expects [16000

    0熱度

    1回答

    我正在使用Microsoft認知語音到文本API,並且我的問題是 如何檢測正在分析的音頻的語言?這可能嗎?

    0熱度

    1回答

    Android開發新手,試圖將語音實現爲文本,將實時打印屏幕上的文字,但獲得以下錯誤。似乎無法理解問題出在哪裏。是因爲我從togglebutton事件中調用了startRecording()和stopRecording()還是完全是其他內容。 com.example.android.movi​​ebud E/SpeechRecognizer:未連接到識別服務 package com.example