speech-recognition

    0熱度

    1回答

    快速的新手!我正在嘗試使用語音識別器來實現將語音轉換爲文本的應用程序。 問題 SFSpeechRecognizer().isAvailable是false private let request = SFSpeechAudioBufferRecognitionRequest() private var task: SFSpeechRecognitionTask? private let eng

    -1熱度

    1回答

    我想在C#窗口應用程序中創建一個Windows應用程序,應用程序應使用IBM Watson服務執行語音到文本轉換。 我們應該如何實現IBM Watson Speech to Text API服務 https://stream.watsonplatform.net/speech-to-text/api應該聽用戶的聲音並編寫輸出文本。 我搜索了很多文章,在所有這些例子中,.wav(音頻)文件作爲輸入傳

    1熱度

    1回答

    我需要開發一個語音識別軟件,所以我使用Python的Pocketsphinx。 我想識別幾個單詞,因此我使用帶閾值的關鍵詞列表來排除語法單詞。 我到目前爲止這樣的代碼: #!/usr/bin/env python import os from pocketsphinx import LiveSpeech, get_model_path model_path = get_model_pat

    2熱度

    1回答

    我在Raspberry Pi上使用Google python語音識別,效果非常好。然而,它不斷地傾聽,我寧願有一個喚醒詞,以便它只在我需要時聽。 此刻它一直收聽直到出現沉默(或返回到任何環境背景噪聲),然後將聲音片段發送到API以進行語音識別。我有沒有辦法縮短它正在聽的時間長度?這樣,它一次只能聽一個單詞,並等待我設定的任何喚醒詞。

    1熱度

    1回答

    我正在使用android中使用pocketsphinx語音識別器的個人助理。這是我的應用程序每次聽到特殊字詞時的個人助理會回覆並執行任務的方式。麥克風的釋放我一直有一些問題。我不知道它是否是一個錯誤。它僅在我關閉應用程序時纔會發生,麥克風仍然在查找該單詞並使用文本到語音進行回答。即使屏幕關閉。當我試圖錄制視頻時,表示麥克風被其他應用程序使用。所以我必須再次打開我的應用程序並關閉應用程序以釋放麥克風

    0熱度

    1回答

    我在我的應用程序中使用recognitionlistener界面將語音轉換爲文本。不過,我想在演講後立即顯示來自演講的轉換文本。如果我說4-5個單詞,那麼只要我說一個單詞就應該顯示第一個單詞。總之就像谷歌助理。我正在重寫它的onresults方法並顯示調用此方法時的結果。有沒有辦法一次檢測出一個單詞並逐一顯示? https://drive.google.com/open?id=0BxHdMJXrM

    0熱度

    1回答

    我是用JavaScript的語音識別API(new webkitSpeechRecognition())工作,我感到驚訝,爲什麼它沒有互聯網的工作,因爲它是JavaScript代碼,所以它應該脫機工作 我檢查的Chrome開發者工具的網段,甚至不做要求互聯網

    0熱度

    1回答

    在很多語音識別論文中,我看到這個術語「幀的上下文窗口」。我不確定這一點,但看起來好像你從一個話語中取出一個幀x,並且將這個幀連接到5個先前幀和5個未來幀。這個上下文窗口的標籤是中心框架。我對嗎? 謝謝 (順便說一下5號只是一個例子)

    0熱度

    1回答

    我想做一個android遊戲(使用統一遊戲引擎),我希望這個遊戲有語音識別功能。 我想用使用谷歌API的Android應用程序進行語音識別,但我想將識別結果發送到另一個應用程序,這是統一遊戲。 我該怎麼辦?它有效嗎? P.S .:我知道谷歌提供了一個統一的插件,但我不想使用它。

    3熱度

    2回答

    有沒有人曾試圖用兩個或更多的語音向文本API轉錄音頻?你可以使用時間戳來匹配單詞,並以最高的可信度選擇單詞。如果有人這樣做,是否顯着提高了轉錄的準確性?這值得麼?