3
我正在研究一個語音識別器項目作爲它想要從一個WAV文件的一部分想要找到沉默的存在或檢測單詞的存在。如果找到一個單詞,然後將該單詞從頭到尾複製到一個新的wav文件,因此原來的wav文件有10個字,然後輸出爲10 file..problem與檢測沉默或字 想就如何落實這在Java .. 請提出建議..如何檢測使用java的wav文件中是否存在單詞/音頻沉默?
我正在研究一個語音識別器項目作爲它想要從一個WAV文件的一部分想要找到沉默的存在或檢測單詞的存在。如果找到一個單詞,然後將該單詞從頭到尾複製到一個新的wav文件,因此原來的wav文件有10個字,然後輸出爲10 file..problem與檢測沉默或字 想就如何落實這在Java .. 請提出建議..如何檢測使用java的wav文件中是否存在單詞/音頻沉默?
好,WAV只是PCM數據。我開始閱讀: http://en.wikipedia.org/wiki/Pulse-code_modulation
我以前做過這個... 你開始從PCM數據中提取樣本。然後檢查每一個是否大於您設置的閾值。例如,假設16位採樣...例如從零到15000的任何值都是靜音,大於15001的任何值都是聲音。只要記住要處理未簽名的整數,否則在PCM中你會有負面的。另外,當你玩這個門檻時,請記住log vs linear。