speech-to-text

    1熱度

    1回答

    使用IBM Watson Twilio的Speech-to-Text附加組件,它使我可以在插件配置選項卡中配置回調URL。 現在我的問題是我如何得到這隻影響一個電話號碼?或特定的TwiML?我不能全部通過附加組件。 例子: 電話號碼1 - >轉到其他一些網絡掛接 電話號碼2 - >使用TwiML斌與<Record> //我想這一個由IBM轉錄附加 我是否應該讓#2擊中使用IBM SDK的webho

    -3熱度

    1回答

    我希望我的應用能夠識別脫機音頻剪輯中說出的數字(1-100)。我沒有找到任何教程。我該怎麼做? 我更喜歡不使用任何API。

    1熱度

    1回答

    我正在嘗試使用IBM Watson Services構建一個應用程序,該應用程序將SPEECH作爲輸入,然後通過IBM Watson Speech轉換爲TEXT文本到Text API,然後將該文本發送到IBM Watson Conversation API並在TEXT中給出結果。現在,我從Conversation API收到的最新TEXT被進一步發送到TEXT TO SPEECH API,並返回期

    0熱度

    1回答

    我試着用樹莓派上的Node-RED對Watson語音進行文本服務,但出現錯誤:缺少音頻語言配置,無法處理語音。我沒有看到在Node-RED節點內指定語言的方法。我錯過了什麼?

    3熱度

    1回答

    我正在探索python中的google雲語音api。我正在關注這個link。 我也提到了這個stackoverflow link。但是我對設置環境變量感到震驚。 我所做的事情: 1.Installed gcloud Python模塊 2.Installed谷歌API的Python客戶端模塊 3.Had設立了服務帳戶(獲得JSON文件) 4.Obtained API密鑰 我獲得了出口GOOGLE_A

    4熱度

    1回答

    首先,我真的不知道我在做什麼,所以我對愚蠢的問題道歉......只是想在這裏按照指示: https://www.microsoft.com/cognitive-services/en-us/Speech-api/documentation/GetStarted/GetStarted-cURL 使用捲曲在Windows上輸入: curl -v -X POST「https://speech.platf

    0熱度

    1回答

    我使用wit.ai作爲我自己的個人助理中的語音到文本服務的臨時解決方案(可能)。然後,我將這個轉錄的文本傳遞給其他地方以供進一步分析。最終,我可能會轉移到一些更重的東西(沃森,PocketSphinx等),但wit.ai似乎是一個很好的第一步,因爲它是免費和容易的。 但是,我想將我自己的自定義單詞添加到wit.ai.具體來說,我的音樂播放器不是真正英語的樂隊名稱。 理想情況下,我可以上傳一個大文件

    -1熱度

    1回答

    我一直在使用PocketSphinx製作自然語言的語音識別器。我不想使用語法,而是使用語言模型。 我可以在網上找到任何已經完成的東西嗎? 每個人都在鏈接this page,但它只包含聲學模型,我正在尋找帶有統計語言模型的.dmp或ARPA文件。 我可以自己做,但這是一段時間,我不相信沒有什麼可以下載的英語語言。

    0熱度

    1回答

    我正在嘗試使用python 3.5.1的語音識別模塊來激活我的jarvis AI語音!我查看了堆棧溢出,發現了一些類似於我的問題,但他們沒有我需要的答案,我需要一個爲此個性化的答案。我已經下載了所有必需的包和仍然沒有運氣,我得到這個錯誤:如果我運行 ImportError: No module named 'speech_recognition' : python -m speech_reco

    1熱度

    1回答

    我要發展,應支持語音到文本和文本到語音應用程序, 我)語音到文本 - 程序 - 我有使用語音框架語音到文本,每當我打開一個應用程序,如果我開始說話,應用程序應該識別語音,並應該將語音轉換爲文本。這是工作 ii)文本到語音 - 過程 - 我有使用AVFoundation和MediaPlayer庫如果用戶按下播放按鈕,它應該將文本,即任何出現在屏幕上的語音轉換爲語音。現在開始工作。 這裏是現在面臨 在