我想要構建一個Android應用程序,它將識別我的聲音,將其轉換爲文本,並顯示我剛剛講話的內容。我可以通過使用一個按鈕來爲我啓動語音識別器。但是現在我只想讓它在我的聲音基礎上工作。基於語音(噪聲)強度的語音識別?
應用程序應該觸發語音識別器,並且只有當我開始講話時纔開始聆聽我,並且當它感應到沉默時應該停止聆聽。就像湯姆應用程序的功能一樣。它會記錄聲音,但我想用聲音識別器識別它。有些事情是這樣的:
if(no silense)
Launch Recognizer
else if(silence)
Stop Recognizer
Show toast
的主要問題是,我怎麼能當用戶推出語音識別之前說什麼或不出來。有什麼辦法來感覺噪音強度.. ??其次,有沒有什麼辦法在後臺啓動語音識別器......?
是否有可能在後臺服務中檢測到音頻信號(某人開始講話),然後立即啓動語音識別器來識別語音。
會說話的湯姆也改變其他聲音,不僅聲音,所以它可能會不斷記錄音頻,應用過濾器和連續播放聲音。 –
@nininho我知道它會記錄聲音。那就是我在問題中提到的。我只想知道,只有當有一些沉默差距時,它纔會迴應。當它迴應時它一定感覺到了沉默。主要想法是,我只想知道如何感知無聲的差距,這樣我就可以在這些差距中解決一些意圖。 – Pargat
那麼,你的聲音有一個特定的頻率範圍,稱爲語音頻帶。這個範圍從300赫茲到3400赫茲。您可以使用數字濾波器來偵聽該範圍內的某些內容。除此之外,我不太確定。 –