這篇文章更多的是關於澄清,而不是實現某種音頻波形算法。我讀過有關的主題(包括對SO進出網絡上)的帖子無數,這裏就是我已經收集:生成音頻波形
- 在16位WAV的背景下,我想讀的每兩個字節作爲
short
,這將導致介於-32768到32767之間的值。 - 對於44.1kHz的採樣率,每一秒音頻將有44000個採樣。
這是相當直接的,但是我有以下問題:
- 在單聲道呈現的WAV只有一個信道,這是每幀信息的兩個字節。在立體聲中,這成爲四個字節的信息。在我的情況下,我不需要顯示兩個頻道,所以我只需跳過正確的頻道並只讀取左側的頻道?我讀過的一些解決方案提到了將左右聲道結合起來,但我不確定這是否是必需的。
- 假設我有一個長度爲兩秒的音頻文件,另一個長度爲三十秒的音頻文件。如果我需要抓取最少800個樣本來表示波形,則會沿文件長度抓取800個樣本,引入精度問題,例如,對於兩個第二音頻文件爲
(44,000 * 2)/800
,對於第三十二音頻文件爲(44,000 * 30)/800
。
一個解釋真的很感謝!
我們不能回答你的第一個問題,問問給你任務的人。我不明白你的第二個問題。你在談論哪個「特定區域」?您需要2 * 44k採樣來表示兩秒的音頻。這就是採樣率的定義。使用22k樣本無法錄製44k音頻。 –
@TamasHegedus我更新了我的第二個問題。我試圖儘可能地重新說出它。簡而言之,我只是試圖確定44,000個樣本區域內的樣本是否瘋狂地變化,以及是否需要進行某種平均。 – Raggeth
是啊這兩個問題需要澄清 - 通過收集一堆信息不會提出一個問題 - 你沒有達到它似乎的東西,你試圖解釋一些你不明白的東西 - 告訴我如何做到這一點 – gpasch