speech-recognition

1熱度

1回答

我目前正在嘗試使用由kaldi提供的add-deltas二進制文件來提取delta + delta-delta。但由於某些原因，我無法提取它。我通常使用make_spectrum.sh腳本提取功率譜。我修改了一下，還包括增量，但是輸出與沒有增量部分的輸出沒有任何區別。我在做什麼錯？ $cmd JOB=1:$nj $logdir/spect_${name}.JOB.log \ com

-3熱度

1回答

在android中的音頻文件中識別數字（1-100）

我希望我的應用能夠識別脫機音頻剪輯中說出的數字（1-100）。我沒有找到任何教程。我該怎麼做？我更喜歡不使用任何API。

1熱度

1回答

如何在python上結合語音識別和pyttsx 2.7

我是python的新手，並且一直在學習如何使用python語音識別「pygsr」和pyttsx，現在我想知道如何組合代碼以實現共同目標，即：當我與該計劃交談時，它會給我一個迴應。我使用Python 2.7 在Windows 8 和我已經安裝了語音識別和pyttsx庫這是代碼pyttsx代碼 import pyttsx engine = pyttsx.init() engine.say ('

0熱度

1回答

谷歌的NodeJS語音API流將停止

2熱度

1回答

通過websockets流式傳輸音頻IBM不工作

我正嘗試通過IBM Watson websockets通過麥克風流式傳輸音頻。我收到以下錯誤： TypeError: The system cannot find the file specified 我覺得子進程有問題，請幫我解決這個問題/讓它工作。 from ws4py.client.threadedclient import WebSocketClient import base64, j

1熱度

1回答

Google語音識別API不在監聽

我正在使用Google Speech API嘗試以下語音識別代碼。 #!/usr/bin/env python3 # Requires PyAudio and PySpeech. import speech_recognition as sr # Record Audio r = sr.Recognizer() with sr.Microphone() as source:

0熱度

1回答

LiveSpeechRecognizer打印隨機單詞

我的程序基本上是以語音轉文本。我正在使用LiveSpeechRecognizer CMU Sphinx。我的程序運行時沒有任何錯誤，但沒有打印文字。我的意思是它從我的語法文件中打印隨機單詞。我用我的三星手機耳機作爲我的麥克風代碼： /* * To change this license header, choose License Headers in Project Properties.

0熱度

1回答

斯威夫特3音頻不會播放

基本上我試圖將語音識別合併到我正在構建的應用程序中。我希望能夠在按下麥克風按鈕時播放聲音，然後開始錄製和識別音頻。問題是，當我按下按鈕時，沒有聲音播放。另外，當我在我的物理iPhone上運行應用程序時，控制面板中的聲音滑塊消失。任何人都可以幫忙嗎？這裏是我的代碼： class VoiceViewController: UIViewController, SFSpeechRecognizerDel

0熱度

1回答

我在哪裏可以找到使用谷歌的應用程序可以語音轉錄錄音？

我正在尋找一個應用程序（Windows，Linux或IOS）使用谷歌雲語音。我還沒有成功獲得一些運行的Python腳本（使用API和我自己的json密鑰生成）

-2熱度

1回答

VOCE無語法語音識別

我是Java和speech recognition的初學者，我正在使用VOCE（http://voce.sourceforge.net/）將語音轉換爲文本。我使用了提供的示例，它只能識別.gram文件中指定的單詞。但是，我需要應用識別比語法文件中指定的單詞多得多的單詞。我發現這個相似的問題（Speech Recognition API without Grammar C#），但我不知道，如果解