2017-04-04 233 views
1

我正在研究客戶關懷數據的語音情感分析。我有一個音頻文件,客戶服務人員詢問問題並且客戶已經給出了他的評論。如何在Python中分割音頻文件

我需要拆分這個音頻,並且只有客戶的評論部分才能進行情感分析,無論客戶是開心,悲傷還是中立。

請讓我知道,如何分割音頻文件,以獲得客戶的音頻。音頻格式爲「.AAC」

到目前爲止,這是我做了什麼:

from os import path 
AUDIO_FILE = path.join(path.dirname(path.realpath('C:\\Users\\anagha\\Documents\\Python Scripts')),"Python Scripts\\audioa.aac") 

halfway_point = len(AUDIO_FILE)/2 
+0

如果您只是想根據大小或靜音進行分割你可以看看http://stackoverflow.com/questions/37725416/pydub-combine-split-on-silence-with-minimum-length-file-size 但是,我相信你需要做的第一個決定你將如何區分客戶和客戶音頻。也許,語音識別工具將會有所幫助。 –

+0

謝謝,有關如何區分客戶和客戶音頻的建議? – Anagha

回答

2

,因爲你使用的pydub標籤,這裏是如何與pydub

from pydub import AudioSegment 
sound = AudioSegment.from_file(AUDIO_FILE) 

halfway_point = len(sound) // 2 
first_half = sound[:halfway_point] 

# create a new file "first_half.mp3": 
first_half.export("/path/to/first_half.mp3", format="mp3") 
+0

謝謝。但是如何得到輸出結果並看看它是否被削減?或者我如何導出輸出? – Anagha

+0

@Anagha更新了出口線路的答案 – Jiaaro

0

我認爲它太晚回答原來的問題,但有人絆倒這個問題可能會發現有用的程序

- >使用工具來diarize數據。我已經使用LIUM(http://www-lium.univ-lemans.fr/diarization/doku.php

- >解釋在此基礎上巧妙的簡單輸出,使後(Parsing LIUM Speaker Diarization Output

,最後用從上面獲得的時序拼接音頻文件!將語音轉換爲文本雖然是完全不同的挑戰,但要麼需要深入研究(數據量巨大),要麼依賴API提供商(如谷歌)