audio-analysis

    -2熱度

    1回答

    我需要對聲音進行分析以檢查它是否受到阻礙或刪除。 import java.net.URL; import javax.swing.*; import javax.sound.sampled.*; public class LoopSounds { public static void main(String[] args) throws Exception { UR

    0熱度

    1回答

    我想開始開發一些涉及音頻分析的iOS應用程序。我一直在閱讀一些蘋果的文檔,如Audio Session Programming Guide,但我仍然需要從音頻分析開始。我想知道我應該怎麼做,比如在Shazam應用中:你怎麼能比較兩個音頻文件/流?或者像其他幾個應用一樣:您如何檢測音頻文件或流的節奏,讓我們假設一個動畫以相同的節奏移動? 我需要一些指導,我知道我錯過了一些音頻分析基礎知識,我會很感激

    1熱度

    1回答

    我正在製作一個應記錄可識別音頻的程序,以便稍後可以輕鬆地將其與其他音頻文件進行比較。 音頻文件將包含類似的講話,所以我想知道什麼是更容易做到: 實現語音識別算法和保存/比較輸出, 或執行/創造了一種算法,創建類似於例如音頻指紋的東西快速傅里葉變換並比較這些? 有沒有人在這方面的一些經驗?我想知道第二種解決方案是否能在相對較短的時間內實現。也許有一種解決方案不太難編碼,我只是沒有找到它?

    0熱度

    1回答

    我正在使用marf的SpeakerIdentApp進行音頻分析。 我想用speakerIdentApp提供的其他數據探索它。 我嘗試了一些波形文件:http://www.wavsource.com/,但這些文件不被marf支持。 nullwave is not 16 bit file 然後,試圖SOX的文件隱蔽到16位。但這些文件是MP3編碼,它不支持MP3編碼的wav文件。 所以我的問題是要

    4熱度

    1回答

    問題 想要檢測一個人或機器的來電是否應答。 詳情 上午在使用Twilio。而Twilio確實有這個功能。然而,它在系統中實現的方式似乎不適合我的用例。 Twilio使用應答機檢測來控制呼叫流程。因此,Twilio在呼叫連接後等待幾秒鐘,以便分析來自呼叫的音頻以查看它是否是應答機。它不會繼續將呼叫連接到延遲呼叫並執行此分析之後。 對於我的用例。天氣通話由一個人或機器應答不會影響通話流程...所以延遲

    1熱度

    1回答

    網絡瀏覽器中的音頻分析可以通過AnalyserNode of Web Audio API輕鬆執行。 Node.js有類似的東西嗎?

    1熱度

    1回答

    我想用aubiopitch連續輸出來自輸入源的信號的頻率。由於aubiopitch喜歡有它的輸入是一個文件,不是甲流,我嘗試使用process substitution: $ aubiopitch -i <(sox -q -d -t wav -) 我預計這將輸出信號的頻率被讀出我的默認的音頻輸入設備。相反,我得到這個: ./sox WARN wav: Length in output .wav

    0熱度

    1回答

    我正在使用一個外部聲卡設備,它有4個麥克風輸入,它通過USB連接到我的筆記本電腦。因此,我需要從麥克風中採集音頻樣本,並製作條形圖或任何圖形,以顯示哪個麥克風捕捉了第一聲,第二聲,第三聲和第四聲!我曾想過在csv文件中捕獲這些信息,然後做圖表? 請幫忙嗎? 謝謝!

    2熱度

    1回答

    我正在Python中進行音頻分析。我的最終目標是獲取頻率及其各自的音量列表,如{ frequency : volume (0.0 - 1.0) }。 我的音頻數據爲-1.0和+1.0之間的值列表。我在此列表上使用了numpy的fourier轉換 - numpy.fftpack.fft()。但結果數據對我來說毫無意義。 我明白,傅里葉變換從時間變換到頻域,但不完全如何數學運作。這就是爲什麼我不太瞭解

    2熱度

    1回答

    我想分析一個來自url的實時音頻流。 我已經測試我的代碼以麥克風輸入和它運作良好,但是當我改變 createMediaStreamSource(micStream) 要 var streamURL = new Audio(['http://urlOnRemoteServer']) createMediaStreamSource(streamURL) 然後getByteFrequencyD