speech-recognition

    1熱度

    1回答

    我目前正在嘗試使用由kaldi提供的add-deltas二進制文件來提取delta + delta-delta。但由於某些原因,我無法提取它。 我通常使用make_spectrum.sh腳本提取功率譜。 我修改了一下,還包括增量,但是輸出與沒有增量部分的輸出沒有任何區別。 我在做什麼錯? $cmd JOB=1:$nj $logdir/spect_${name}.JOB.log \ com

    -3熱度

    1回答

    我希望我的應用能夠識別脫機音頻剪輯中說出的數字(1-100)。我沒有找到任何教程。我該怎麼做? 我更喜歡不使用任何API。

    1熱度

    1回答

    我是python的新手,並且一直在學習如何使用python語音識別「pygsr」和pyttsx,現在我想知道如何組合代碼以實現共同目標,即:當我與該計劃交談時,它會給我一個迴應。 我使用Python 2.7 在Windows 8 和我已經安裝了語音識別和pyttsx庫 這是代碼pyttsx代碼 import pyttsx engine = pyttsx.init() engine.say ('

    0熱度

    1回答

    我從https://github.com/GoogleCloudPlatform/nodejs-docs-samples/tree/master/speech力壓下面的示例代碼(recognize.js)(需要用this AUTH):節點recognize.js聽: /** * Copyright 2016, Google, Inc. * Licensed under the Apache L

    2熱度

    1回答

    我正嘗試通過IBM Watson websockets通過麥克風流式傳輸音頻。我收到以下錯誤: TypeError: The system cannot find the file specified 我覺得子進程有問題,請幫我解決這個問題/讓它工作。 from ws4py.client.threadedclient import WebSocketClient import base64, j

    1熱度

    1回答

    我正在使用Google Speech API嘗試以下語音識別代碼。 #!/usr/bin/env python3 # Requires PyAudio and PySpeech. import speech_recognition as sr # Record Audio r = sr.Recognizer() with sr.Microphone() as source:

    0熱度

    1回答

    我的程序基本上是以語音轉文本。我正在使用LiveSpeechRecognizer CMU Sphinx。我的程序運行時沒有任何錯誤,但沒有打印文字。我的意思是它從我的語法文件中打印隨機單詞。 我用我的三星手機耳機作爲我的麥克風 代碼: /* * To change this license header, choose License Headers in Project Properties.

    0熱度

    1回答

    基本上我試圖將語音識別合併到我正在構建的應用程序中。我希望能夠在按下麥克風按鈕時播放聲音,然後開始錄製和識別音頻。問題是,當我按下按鈕時,沒有聲音播放。另外,當我在我的物理iPhone上運行應用程序時,控制面板中的聲音滑塊消失。任何人都可以幫忙嗎? 這裏是我的代碼: class VoiceViewController: UIViewController, SFSpeechRecognizerDel

    0熱度

    1回答

    我正在尋找一個應用程序(Windows,Linux或IOS)使用谷歌雲語音。我還沒有成功獲得一些運行的Python腳本(使用API​​和我自己的json密鑰生成)

    -2熱度

    1回答

    我是Java和speech recognition的初學者,我正在使用VOCE(http://voce.sourceforge.net/)將語音轉換爲文本。 我使用了提供的示例,它只能識別.gram文件中指定的單詞。但是,我需要應用識別比語法文件中指定的單詞多得多的單詞。 我發現這個相似的問題(Speech Recognition API without Grammar C#),但我不知道,如果解