2014-11-05 55 views
2

我正在iOS上使用簡單的網絡電臺應用程序進行簡單的語音/音樂辨別。主要想法是一個收音機,它從url播放一個信號,同時它檢查正在播放的是什麼類型的信號。當它檢測到語音時,它會更改頻道等。iOS將URL中的音頻分爲幀

我寫了一個簡單的iOS應用程序,使用故事板和AVFoundation播放器。我在執行語音檢測時遇到問題。我爲算法編寫了一個Matlab代碼,但我不確定如何在Xcode中完成此操作。

clear all 
close all 
[s, fs] = audioread('nagranie.wav'); 
length = length(s)/fs; 
lengthofframe20ms = 0.2*fs; 
numberofframes20ms = round(length(s)/lengthofframe20ms); 
s1 = zeros(lengthofframe20ms*numberofframes20ms,1); 
for i=1:1:length(s(:,1)) 
s1(i,1)=s(i,1); 
end 
frame20ms=zeros(numberofframes20ms,lengthofframe20ms); 
for i=1:1:numberofframes20ms 
for j=1:1:lengthofframe20ms 
frame20ms(i,j)=s1(j+3200*(i-1),1); 
end 
end 
lengthofframe260ms = 2.6*fs; 
numberofframes260ms = round(length(s)/lengthofframe260ms); 
s2 = zeros(lengthofframe260ms*numberofframes260ms,1); 
for i=1:1:length(s(:,1)) 
s2(i,1)=s(i,1); 
end 
frame260ms=zeros(numberofframes260ms,lengthofframe260ms); 
for i=1:1:numberofframes260ms 
for j=1:1:lengthofframe20ms 
frame260ms(i,j)=s1(j+41600*(i-1),1); 
end 
end 
En = zeros(numberofframes20ms,1); 
for i=1:1:numberofframes20ms 
L=length(frame20ms(i,:)); 
En(i)=(norm(frame20ms(i,:))^2)/L; 
end 
Ek = zeros(numberofframes260ms,1); 
for i=1:1:numberofframes260ms 
L=length(frame260ms(i,:)); 
Ek(i)=(norm(frame260ms(i,:))^2)/L; 
end 
sumN = 0; 
for i=1:1:length(En) 
sumN=sumN+En(i); 
end 
sumK = 0; 
for i=1:1:length(Ek) 
sumK=sumK+Ek(i); 
end 
EnP = zeros(numberofframes20ms,1); 
for i=1:1:numberofframes20ms 
EnP(i)=((En(i))/sumK); 
end 
treshold = 0.5; 
lambda=treshold*sumN; 

M=numberofframes20ms/numberofframes260ms; 
coff=zeros(numberofframes20ms,1); 
for i=1:1:numberofframes20ms 
if (En(i)<lambda) 
for k=1:1:numberofframes260ms 
if (((k-1)*M+1)<i) && (i<k*M) 
coff(i)=1; 
end 
end 
end 
end 

正如你可以首先我們來劃分信號見成20ms的幀和更大的260個毫秒幀,然後我們計算每20ms的幀的能量,做一些更多的數學,並在最後一點上,我們檢查條件,當它適合它的語音,當它不幀時被排序爲音樂。

我不知道如何開始做歧視部分。我應該使用哪種框架?我認爲它不是很難,因爲它花了我20分鐘才寫在MatLab中。 :)

這是怎麼了我的應用程序播放的電臺:

{ 
RadioInfo *sharedRadio = [RadioInfo sharedRadio]; 
NSString *program = [NSString stringWithFormat:@"%@",sharedRadio.list[value]]; 
NSURL *url = [NSURL URLWithString:program]; 
AVPlayerItem *playerItem = [AVPlayerItem playerItemWithURL:url]; 
self.playerItem = [AVPlayerItem playerItemWithURL:url]; 
self.player = [AVPlayer playerWithPlayerItem:playerItem]; 
self.player = [AVPlayer playerWithURL:url]; 
[self.player pause]; 
[self.player play]; 

}

這是我的第一篇文章在這裏,所以請善待。我會感激和幫助。我被困在這一部分。

回答

1

如果您想獲取音頻數據並播放它,您可以使用比AvPlayer更低級別的API。 AVPlayer太高級別,它不允許您訪問音頻數據。您可以通過HTTP檢索您的音頻,並在分析後使用AvAudioPLayer框架進行播放。但是,當然你必須自己實施許多事情。

NSURL *url = [NSURL URLWithString:@"http://devimages.apple.com/iphone/samples/bipbop/bipbopall.m3u8"]; 
    NSData *soundData = [NSData dataWithContentsOfURL:url]; 

    // analyze sound data here and switch URL if needed 

    audioPlayer = [[AVAudioPlayer alloc] initWithData:soundData error:NULL]; 
    audioPlayer.delegate = self; 
    [audioPlayer play]; 
+0

我正在處理連續的.mp3文件。也許你知道如何創建* soundData只有一部分文件?如果我可以創建一個只有約250 ms來自URL的信號的NSData文件,那將是非常好的。 – 2014-11-16 15:16:27

+1

您必須使用音頻轉換器將mp3數據轉換爲原始數據。閱讀https://developer.apple.com/library/mac/Documentation/MusicAudio/Reference/ExtendedAudioFileServicesReference/index.html以供參考,這裏也有許多例子討論它。 – 2014-11-16 20:13:15